现象:DS5300报警灯亮,登陆SM检查,发现RecoveryGuru中报警:Logical Drive Not On Preferred Path,当时以为是简单的路径切换问题,但当我准备收工切回去的时候,机器的报警灯灭了,这条报警也没了。大概过了三四分钟,报警灯又亮了,还是非最优路径的报警,不过我发现已经不是刚才报警的那个LUN了,于是没做操作的等了几分钟,报警又消失了,然后就这样一直一会报警一会没有的,每次都是不同的LUN在非最优路径上。
打开看了一下event,只有下面几条信息一直在重复出现,但都是Informational类的。
Sequence number: 68157
Event type: 400E
Event category: Internal
Priority: Informational
Description: Automatic logical drive transfer started
Event specific codes: 0/0/0
Component type: Controller
Component location: Enclosure 85, Slot 1
Logged by: Controller in slot A
Sequence number: 68156
Event type: 202F
Event category: Internal
Priority: Informational
Description: Automatic logical drive transfer completed
Event specific codes: 0/0/0
Component type: Controller
Component location: Enclosure 85, Slot 1
Logged by: Controller in slot A
Sequence number: 68155
Event type: 210A
Event category: Internal
Priority: Informational
Description: Controller cache not enabled or was internally disabled
Event specific codes: 0/0/0
Component type: Controller
Component location: Enclosure 85, Slot 1
Logged by: Controller in slot A
就是上面这三条信息每隔几分钟就出现一次,贴出来的是Controller in slot A的,Controller in slot B也是这三条,A和B交替报这三条信息。
我也点开每个LUN看过,cache状态都是正常的。
机器微码:
Firmware version: 07.60.40.00
NVSRAM version: N1818D53R1060V14
EMW version: 10.60.G5.05
AMW version: 10.60.G5.05
机器用了5年多,应该是没有升级过微码。这个现象最近才出现的,之前应该是没有过。
目前只有一个Raid组在用,划了5个LUN,连接的是windows系统的虚拟化主机。
其他部件(包括电池),在SM中全是绿色正常状态。
我自己本来怀疑是一个控制器的cache不稳定了,但是后来看了event后发现两个控制器都报同样的信息,而且且换路径也是从哪个控制器切换到哪个控制器的情况都有。后来觉得是不是主机端或者交换机哪个端口不稳定了造成的切换,但如果是主机端引起的切换(主机端是如何进行多路径管理暂时没确定),有一点不明白的是为什么会有Controller cache not enabled or was internally disabled这样一条信息?
难道需要升级微码?但是之前几年就没这个问题。
求助一下,哪位遇到过这样的问题。什么原因引起的?如何解决?
多谢大家!