环境:
1)一个刀箱,slot1-3为powerblade,slot4-7为x86刀片,slot7-14为空槽位
2)外置存储为DS5020,A控只有一条光纤线直连到刀箱背后的光纤交换模块1,B控制有一条光纤线直连到刀箱背后的光纤交换模块2
故障:
slot2的powerblade AIX里每天不断大面积报错DCB47997 T H hdisk3 Disk Operation Error。hdisk3为DS5020上的映射到此刀片上LUN,属于HA的资源组,光纤交换模块的port2端口同时报出相同数量的enc in,crc err, crc g eof
维护:
1)更换HBA卡,升级HBA卡和光纤交换模块的微码,这些报错减少了很多,但每天都报1-2个
2)将slot2和slot3的刀片互换位置,报错没有跟刀片移位,还是报在slot2的刀片
3)升级刀片微码,更换刀箱中板,报错依旧
问题:
这个报错应该就是slot2的链路报错,由于刀片的HBA卡与光纤交换模块是内部链接,不涉及光纤线和SFP模块的问题,这条链路上的设备几乎都被换过了,请问各位高人,这样会是什么问题呢?
谢谢。
收起