互联网服务多路径hdlmoffline

HDLM多路径offline的问题

最近上完一个项目。IBM的LSF。4台io服务器安装gpfs系统。然后接的是HDS VSP G400存储。2台brocade6510的sanswitch。光纤模块都是16G的FC包括HBA也是。4台io服务器的操作系统是rehat7.2的,多路径用hds的HDLM8.4的。

问题:经常会发现lsf集群会卡,然后检查4台io服务器发现有一台io服务器链路就发现链路offline(E)了就会卡。然后把集群切换到一个正常链路的io服务器上就不卡了。反正就是说只要有offline(E)集群就会卡。

现在就是不知道为什么会链路offline(E)而且奇怪的是用HDLM的命令在线去修复都不行。-u all也删除不了offline(E)的链路。一定要把服务器重启了链路又正常了。反复出现。

有问过厂家的人。说有可能是光纤线的问题,因为16G的对线路要求很高,在高峰期io压力大对线路要求高。

把san的端口降速到8G。再观察。不知道大家有没有碰到这个情况。


丢失路劲.png


参与30

5同行回答

skilljiangskilljiang存储架构师COSCON
HDLM的版本和OS的版本是否是官方建议的?另外,看看交换机端有没有CRC的错误?显示全部

HDLM的版本和OS的版本是否是官方建议的?另外,看看交换机端有没有CRC的错误?

收起
轨道交通 · 2016-08-02
浏览4286

提问者

jinruiwei
系统架构师敦阳(宁波)科技有限公司
擅长领域: 服务器存储AIX

相关问题

相关资料

问题状态

  • 发布时间:2016-08-01
  • 关注会员:5 人
  • 问题浏览:8704
  • 最近回答:2016-08-16
  • X社区推广