互联网服务多路径hdlmoffline

HDLM多路径offline的问题

最近上完一个项目。IBM的LSF。4台io服务器安装gpfs系统。然后接的是HDS VSP G400存储。2台brocade6510的sanswitch。光纤模块都是16G的FC包括HBA也是。4台io服务器的操作系统是rehat7.2的,多路径用hds的HDLM8.4的。问题:经常会发现lsf集群会卡,然后检查4台io服务器发现有一...显示全部

最近上完一个项目。IBM的LSF。4台io服务器安装gpfs系统。然后接的是HDS VSP G400存储。2台brocade6510的sanswitch。光纤模块都是16G的FC包括HBA也是。4台io服务器的操作系统是rehat7.2的,多路径用hds的HDLM8.4的。

问题:经常会发现lsf集群会卡,然后检查4台io服务器发现有一台io服务器链路就发现链路offline(E)了就会卡。然后把集群切换到一个正常链路的io服务器上就不卡了。反正就是说只要有offline(E)集群就会卡。

现在就是不知道为什么会链路offline(E)而且奇怪的是用HDLM的命令在线去修复都不行。-u all也删除不了offline(E)的链路。一定要把服务器重启了链路又正常了。反复出现。

有问过厂家的人。说有可能是光纤线的问题,因为16G的对线路要求很高,在高峰期io压力大对线路要求高。

把san的端口降速到8G。再观察。不知道大家有没有碰到这个情况。


丢失路劲.png


收起
参与30

查看其它 4 个回答jinruiwei的回答

jinruiweijinruiwei系统架构师敦阳(宁波)科技有限公司

已经解决。换om4的康宁的光纤线和交换机降速到8G就可以了。16G对链路要求确实很高

互联网服务 · 2016-08-16
浏览4245

回答者

jinruiwei
系统架构师敦阳(宁波)科技有限公司
擅长领域: 服务器存储AIX

jinruiwei 最近回答过的问题

回答状态

  • 发布时间:2016-08-16
  • 关注会员:5 人
  • 回答浏览:4245
  • X社区推广