系统集成ds5300

关于一台DS5300的报警问题

现象:DS5300报警灯亮,登陆SM检查,发现RecoveryGuru中报警:Logical Drive Not On Preferred Path,当时以为是简单的路径切换问题,但当我准备收工切回去的时候,机器的报警灯灭了,这条报警也没了。大概过了三四分钟,报警灯又亮了,还是非最优路径的报警,不过我发现已经不是刚才报警的那个LUN了,于是没做操作的等了几分钟,报警又消失了,然后就这样一直一会报警一会没有的,每次都是不同的LUN在非最优路径上。

打开看了一下event,只有下面几条信息一直在重复出现,但都是Informational类的。

Sequence number: 68157

Event type: 400E

Event category: Internal

Priority: Informational

Description: Automatic logical drive transfer started

Event specific codes: 0/0/0

Component type: Controller

Component location: Enclosure 85, Slot 1

Logged by: Controller in slot A


Sequence number: 68156

Event type: 202F

Event category: Internal

Priority: Informational

Description: Automatic logical drive transfer completed

Event specific codes: 0/0/0

Component type: Controller

Component location: Enclosure 85, Slot 1

Logged by: Controller in slot A


Sequence number: 68155

Event type: 210A

Event category: Internal

Priority: Informational

Description: Controller cache not enabled or was internally disabled

Event specific codes: 0/0/0

Component type: Controller

Component location: Enclosure 85, Slot 1

Logged by: Controller in slot A

就是上面这三条信息每隔几分钟就出现一次,贴出来的是Controller in slot A的,Controller in slot B也是这三条,A和B交替报这三条信息。

我也点开每个LUN看过,cache状态都是正常的。

机器微码:

Firmware version:                    07.60.40.00      

NVSRAM version:                      N1818D53R1060V14  

EMW version:                         10.60.G5.05      

AMW version:                         10.60.G5.05  

机器用了5年多,应该是没有升级过微码。这个现象最近才出现的,之前应该是没有过。

目前只有一个Raid组在用,划了5个LUN,连接的是windows系统的虚拟化主机。

其他部件(包括电池),在SM中全是绿色正常状态。

我自己本来怀疑是一个控制器的cache不稳定了,但是后来看了event后发现两个控制器都报同样的信息,而且且换路径也是从哪个控制器切换到哪个控制器的情况都有。后来觉得是不是主机端或者交换机哪个端口不稳定了造成的切换,但如果是主机端引起的切换(主机端是如何进行多路径管理暂时没确定),有一点不明白的是为什么会有Controller cache not enabled or was internally disabled这样一条信息?

难道需要升级微码?但是之前几年就没这个问题。

求助一下,哪位遇到过这样的问题。什么原因引起的?如何解决?

多谢大家!

参与9

2同行回答

jiaxu2000jiaxu2000系统工程师沈阳医学院附属中心医院
我觉得是host那边动过什么东西,或者是增加了host,检查一下吧。微码是老了点,SSIC的兼容性上应该没有了,不过几百天必须重启的那个bug这个微码应该修复过。如果没有什么变动不该会这样,主要检查host的变动,考虑升级hba的驱动,重启host和存储,升级微码最后考虑...显示全部

我觉得是host那边动过什么东西,或者是增加了host,检查一下吧。微码是老了点,SSIC的兼容性上应该没有了,不过几百天必须重启的那个bug这个微码应该修复过。如果没有什么变动不该会这样,主要检查host的变动,考虑升级hba的驱动,重启host和存储,升级微码最后考虑

收起
事业单位 · 2016-01-08
浏览3469
  • 我也主要考虑主机端的问题,但是有点想不明白那条说cache被禁用的信息为什么总出现?虽然lun的cache设置正常。
    2016-01-08
jiaxu2000jiaxu2000系统工程师沈阳医学院附属中心医院
windows系统的虚拟化主机?hypre-v?显示全部

windows系统的虚拟化主机?hypre-v?

收起
事业单位 · 2016-01-08
浏览3602

提问者

marslumm
系统工程师CIT
擅长领域: AIXUnix服务器

相关问题

问题状态

  • 发布时间:2016-01-08
  • 关注会员:3 人
  • 问题浏览:6743
  • 最近回答:2016-01-08
  • X社区推广