故障引起原因:
有人手贱,误按V7000扩展柜左边按钮,导致此扩展柜脱机。
现象如下:
上图为了看led图标(为了上图)
管理界面:
状态说明:
1、 expansion-4显示联机
2、 电源管理界面说缺失,但是电源图标绿灯
3、 2个容器脱机
4、 此扩展柜硬盘都脱机
5、 此扩展柜相关的mdisk脱机,关联的pool脱机
6、 扩展柜前面版无任何数字,都没点亮
现场救火流程(不保证合法流程):
1、 当时通过修复助手,重新插拔容器,无果。
2、 池都已经脱机,表示我这个扩展柜,无论如何折腾,即便停机,都不会改变这时的数据。
3、 架构是2套v7000,上连svc,做vdm,逻辑上,我其中一台v7000整机关掉,都不会影响我前端服务器的应用,最多,我那套问题v7000推倒重来。(svc vdm的优势)
有了上述条件,大胆干:
1、 怀疑是柜子坏了或者锁了(怀疑理由:电源、容器不可能同时坏,2个电源都显示缺失),扩展柜中间那个板子坏或者锁(上连硬盘下连容器和电源),所以发个空柜子过来
2、 将问题扩展柜下电,不敢做remove expansion,怕扰乱系统内部信息。
3、 将容器、硬盘、电源,按照原来的位置,一一拔插,连好sas线,加电成功,扩展柜前面板显示原来的数字。
4、 根据修复助手,恢复,都是一些校验的东西,如
,走一遍修复过程。
需要朱老师,解决如下疑惑:
1、 扩展柜的那个按钮,究竟是干嘛的;生产机时,误按,是不是加锁了,为保护数据,此扩展柜脱机。
2、 假设坏扩展柜,硬盘的顺序,是否要一一对应。
3、 是否有更好的办法,解决误按问题。