IBM V5000存储报“节点处于脱机状态1196”,“容器间PCIe链接不可操作1006”的警告?

IBM V5000存储(一代2078的机器),这段时间过大概1-2个星期就报“节点处于脱机状态1196”,“容器间PCIe链接不可操作1006”的警告,完了后,节点又自动恢复。开始怀疑是微码的问题,最近已经把微码升级到最新的7.8.1.16了,但还是隔段时间就报这2个警告。请问大牛们有没有遇到过类似的问题,怎么解决?是控制器的问题呢还是主板的问题多点,谢谢!

参与22

5同行回答

waring_idwaring_id  技术经理 , 某公司
确认期间是不是存储控制器切换导致。感觉很像存储多路径自动切换导致显示全部

确认期间是不是存储控制器切换导致。感觉很像存储多路径自动切换导致

收起
零售/批发 · 2023-06-06
  • 谢谢 waring_id的回复,谢谢! 没有动过存储的任何配置,多路径软件为什么要去自动切换?
    2023-06-07
  • 存储内部一般配置2个控制器,控制器的自动切换(有可能是线路或是偶发性的断联引起),我们有遇到过控制器的电池失效会引起自动切换的情况
    2023-06-08
  • 谢谢waring_id大大。线路问题(光纤线、交换机模块)这个这1-2天会让客户更换了看看是否有效果。这台机器倒没有报过电池的问题,但是,同一批次的另外一台存储在上个星期报了电池故障。头痛的是该存储并不是每天都报1196、1006这2个警告,是隔一段时间才会报一次,所以,判断以及处理故障的时间线会拉得很长。
    2023-06-08
匿名用户匿名用户
看看控制器,以及扩展柜和SAS连线问题。排除端口/控制器/线缆等问题显示全部

看看控制器,以及扩展柜和SAS连线问题。排除端口/控制器/线缆等问题

收起
互联网服务 · 2023-06-05
  • 谢谢回复,谢谢!这台存储只有机头,没有连扩展柜,存储主机FC口通过博科300交换机与服务器相连。
    2023-06-05
+zhpeng01可以联系帮忙解决问题。+zhpeng01可以联系帮忙解决问题。  系统工程师 , 信息系统有限公司
主要还是控制器问题,第一怀疑内存,因为控制器自己不能知道是哪条内存坏了,第二是控制器内部操作系统或者服务问题,需要更换控制器或者重启内部服务,或者重装内部的操作系统,有问题再来找我,kejia...显示全部

主要还是控制器问题,第一怀疑内存,因为控制器自己不能知道是哪条内存坏了,第二是控制器内部操作系统或者服务问题,需要更换控制器或者重启内部服务,或者重装内部的操作系统,有问题再来找我,kejia

收起
IT分销/经销 · 2023-06-26
浏览653
圆塘居士圆塘居士  需求管理工程师 , 广州
有大佬说是:这情况,大概率是控制器的内存有问题导致控制器重启。各位,怎么看?显示全部

有大佬说是:这情况,大概率是控制器的内存有问题导致控制器重启。各位,怎么看?

收起
互联网服务 · 2023-06-05
浏览735
zwz99999zwz99999  系统工程师 , dcits
物理链路出问题了,排查一下显示全部

物理链路出问题了,排查一下

收起
系统集成 · 2023-06-05
浏览986
  • 谢谢zwz99999的回复,谢谢!这台存储的拓扑非常简单:只有机头,没有连扩展柜,存储主机FC口通过博科300交换机与服务器相连。
    2023-06-05
  • zwz99999大大,您说是:物理链路出问题,排查一下。能否具体一点?我能想到的是:1、该控制器是否需要offline后拔插一下?2、与该控制器连接的所有光纤线是否需要更换掉?3、与该存储连接的博科交换机端口是否需要更换一下?另外,控制器与主板的问题,完全能排除吗?再次谢谢大大的回复,谢谢!
    2023-06-05

ChatGPT 回答

根据您提供的信息,IBM V5000存储出现“节点处于脱机状态1196”和“容器间PCIe链接不可操作1006”的警告,这可能是由于以下原因导致的:

  1. 控制器故障:控制器可能存在硬件故障,导致节点脱机或PCIe链接不可操作。建议检查控制器的硬件状态,例如电源、风扇、温度传感器等。
  2. 主板故障:主板可能存在硬件故障,导致节点脱机或PCIe链接不可操作。建议检查主板的硬件状态,例如电源、风扇、温度传感器等。
  3. 软件问题:存储系统的软件可能存在问题,例如微码版本不兼容或存在漏洞。建议检查存储系统的软件状态,例如微码版本、驱动程序等。

针对以上问题,您可以尝试以下解决方案:

  1. 检查存储系统的硬件状态,例如控制器、主板、电源、风扇、温度传感器等。
  2. 检查存储系统的软件状态,例如微码版本、驱动程序等。
  3. 如果存储系统存在硬件故障,建议联系IBM客服进行维修或更换。
  4. 如果存储系统存在软件问题,建议升级到最新版本的微码或驱动程序,并进行系统优化和调整。

总之,建议您联系IBM客服进行进一步的诊断和解决方案,以确保存储系统的稳定性和可靠性。

提问者

圆塘居士
需求管理工程师广州
擅长领域: 存储容器云计算

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2023-06-05
  • 关注会员:5 人
  • 问题浏览:2376
  • 最近回答:2023-06-26
  • X社区推广