IBM V5000存储报“节点处于脱机状态1196”,“容器间PCIe链接不可操作1006”的警告?

IBM V5000存储(一代2078的机器),这段时间过大概1-2个星期就报“节点处于脱机状态1196”,“容器间PCIe链接不可操作1006”的警告,完了后,节点又自动恢复。开始怀疑是微码的问题,最近已经把微码升级到最新的7.8.1.16了,但还是隔段时间就报这2个警告。请问大牛们有没有遇到过类似的问题,怎么解决?是控制器的问题呢还是主板的问题多点,谢谢!

参与22

5 同行回答

waring_id waring_id 技术经理 某公司
确认期间是不是存储控制器切换导致。感觉很像存储多路径自动切换导致显示全部

确认期间是不是存储控制器切换导致。感觉很像存储多路径自动切换导致

收起
零售/批发 · 2023-06-06
  • 谢谢 waring_id的回复,谢谢! 没有动过存储的任何配置,多路径软件为什么要去自动切换?
    2023-06-07
  • 存储内部一般配置2个控制器,控制器的自动切换(有可能是线路或是偶发性的断联引起),我们有遇到过控制器的电池失效会引起自动切换的情况
    2023-06-08
  • 谢谢waring_id大大。线路问题(光纤线、交换机模块)这个这1-2天会让客户更换了看看是否有效果。这台机器倒没有报过电池的问题,但是,同一批次的另外一台存储在上个星期报了电池故障。头痛的是该存储并不是每天都报1196、1006这2个警告,是隔一段时间才会报一次,所以,判断以及处理故障的时间线会拉得很长。
    2023-06-08

ChatGPT 回答

根据您提供的信息,IBM V5000存储出现“节点处于脱机状态1196”和“容器间PCIe链接不可操作1006”的警告,这可能是由于以下原因导致的:

  1. 控制器故障:控制器可能存在硬件故障,导致节点脱机或PCIe链接不可操作。建议检查控制器的硬件状态,例如电源、风扇、温度传感器等。
  2. 主板故障:主板可能存在硬件故障,导致节点脱机或PCIe链接不可操作。建议检查主板的硬件状态,例如电源、风扇、温度传感器等。
  3. 软件问题:存储系统的软件可能存在问题,例如微码版本不兼容或存在漏洞。建议检查存储系统的软件状态,例如微码版本、驱动程序等。

针对以上问题,您可以尝试以下解决方案:

  1. 检查存储系统的硬件状态,例如控制器、主板、电源、风扇、温度传感器等。
  2. 检查存储系统的软件状态,例如微码版本、驱动程序等。
  3. 如果存储系统存在硬件故障,建议联系IBM客服进行维修或更换。
  4. 如果存储系统存在软件问题,建议升级到最新版本的微码或驱动程序,并进行系统优化和调整。

总之,建议您联系IBM客服进行进一步的诊断和解决方案,以确保存储系统的稳定性和可靠性。

提问者

圆塘居士
圆塘居士 0 0 3
需求管理工程师 广州
擅长领域: 存储云计算容器
评论8

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2023-06-05
  • 关注会员:5 人
  • 问题浏览:2857
  • 最近回答:2023-06-26
  • X社区推广