互联网服务多路径hdlmoffline

HDLM多路径offline的问题

最近上完一个项目。IBM的LSF。4台io服务器安装gpfs系统。然后接的是HDS VSP G400存储。2台brocade6510的sanswitch。光纤模块都是16G的FC包括HBA也是。4台io服务器的操作系统是rehat7.2的,多路径用hds的HDLM8.4的。问题:经常会发现lsf集群会卡,然后检查4台io服务器发现有一...显示全部

最近上完一个项目。IBM的LSF。4台io服务器安装gpfs系统。然后接的是HDS VSP G400存储。2台brocade6510的sanswitch。光纤模块都是16G的FC包括HBA也是。4台io服务器的操作系统是rehat7.2的,多路径用hds的HDLM8.4的。

问题:经常会发现lsf集群会卡,然后检查4台io服务器发现有一台io服务器链路就发现链路offline(E)了就会卡。然后把集群切换到一个正常链路的io服务器上就不卡了。反正就是说只要有offline(E)集群就会卡。

现在就是不知道为什么会链路offline(E)而且奇怪的是用HDLM的命令在线去修复都不行。-u all也删除不了offline(E)的链路。一定要把服务器重启了链路又正常了。反复出现。

有问过厂家的人。说有可能是光纤线的问题,因为16G的对线路要求很高,在高峰期io压力大对线路要求高。

把san的端口降速到8G。再观察。不知道大家有没有碰到这个情况。


丢失路劲.png


收起
参与30

查看其它 4 个回答jinruiwei的回答

jinruiweijinruiwei系统架构师敦阳(宁波)科技有限公司

HDLM版本可以支持redhat7.2的。我问了hds的厂家。交换机有crc的报错。今天把所有的线都换了。san里只有接11port的端口又出现了faillink。多路径软件有设置的。

51.png


这个就是健康检查默认5分钟。

互联网服务 · 2016-08-04
浏览4617

回答者

jinruiwei
系统架构师敦阳(宁波)科技有限公司
擅长领域: 服务器存储AIX

jinruiwei 最近回答过的问题

回答状态

  • 发布时间:2016-08-04
  • 关注会员:5 人
  • 回答浏览:4617
  • X社区推广