ds 4800出现鬼盘故障,鬼盘在串口下无法删除

背景:客户一台4800故障,登录SM上发现raid 已经降级并OFFLINE ,在SM 上查看硬盘状态,slot 5是空槽位,hotspare 盘状态如下图

存储状态图1.png


后来尝试place array online失败,提示array中有硬盘removed

串口查看

-> cfgPhyList

Ch Devnum
Phydev
State/Status
Flags #Pcs Dg#T/S


0 0000ff 185b7e20
RMVD_OPT/OFFLINE
000080000004
1


000000d 185a8a74
OPTIMAL/OFFLINE
04200000 0004
1
0/13


000000c 185a9e8c
OPTIMAL/OFFLINE
04200000 0004
1
0/12


000000b 185ab2a4
OPTIMAL/OFFLINE
00200000 0004
1
0/11


000000a 185ac6bc
OPTIMAL/OFFLINE
00200000 0004
1
0/10


0000009 185adad4
OPTIMAL/OFFLINE
00200000 0004
1
0/9


0000008 185aeeec
OPTIMAL/OFFLINE
00200000 0004
1
0/8


0000007 185b0304
OPTIMAL/OFFLINE
00200000 0004
1
0/7


0000006 185b171c
OPTIMAL/OFFLINE
00200000 0004
1
0/6


0000005 185b2b34
UNASSIGN/NULL
00200200 0000
0
0/5


0000004 185b3f4c
OPTIMAL/OFFLINE
00200000 0004
1
0/4


0000003 185b5364
OPTIMAL/OFFLINE
00200000 0004
1
0/3


0000002 185b677c
OPTIMAL/OFFLINE
00200000 0004
1
0/2


0000001 185dde9c
OPTIMAL/OFFLINE
00200000 0004
1
0/1

value = 61 = 0x3d = '='

底层有14块盘,而storage manager上显示只有13块,实际上也只有13块插在盘柜中,说明鬼盘存在

最后将鬼盘利用命令 ispcfgFailDrive,0x0000ff
将其手动failed,阵列状态更新为degrade

-> cfgPhyListCh Devnum
Phydev
State/Status

Flags #Pcs Dg# T/S
0 0000ff 194b6c08 RMVD_FAIL/NULL
00008000 0000
1

000000e 1d70b078
UNASSIGN/NULL
00204200 0000
0
0/14
000000d 1d70c490
OPTIMAL/NULL
04200200 0004
1
0/13
000000c 1d70d8a8
OPTIMAL/NULL
04200200 0004
1
0/12
000000b 1d70ecc0
OPTIMAL/NULL
00200000 0004
1
0/11
000000a 1d7100d8
OPTIMAL/NULL
00200000 0004
1
0/10
0000009 1d7114f0
OPTIMAL/NULL
00200000 0004
1
0/9
0000008 1d712908
OPTIMAL/NULL
00200000 0004
1
0/8
0000007 1d713d20
OPTIMAL/NULL
00200000 0004
1
0/7
0000006 1d715138
OPTIMAL/NULL
00200000 0004
1
0/6
0 000005 1d716550
REPLACED/RESTORE
04204000 0004
1
0/5
0000004 1d717968
OPTIMAL/NULL
00200000 0004
1
0/4
0000003 1d718d80
OPTIMAL/NULL
00200000 0004
1
0/3
0000002 1d719d7c
OPTIMAL/NULL
00200000 0004
1
0/2
0000001 1f02f118
OPTIMAL/NULL
00200000 0004
1
0/1value = 61 = 0x3d = '='

现在情况是 陈列状态为degrade ,然后补了两块盘上去,一块在slot 5,一块在slot 14都设置成hotspre后数据开始同步,但是状态为下图,阵列还有告警:如下图


图2.png





这种状态是不正常的,数据盘5号盘的状态不对,然后,底层仍然存一个盘的信息,且无法删除,阵列暂时是可用,有什么办法没有???
参与16

15同行回答

xinyu_261314xinyu_261314系统工程师YXKJ
我曾经遇到过插上新盘不同步的情况,在SM里面找菜单replace drives,在列表里面找到你插入的新盘选中,执行一下replace,就自动同步了。不知道这个对你有没有帮助。显示全部
我曾经遇到过插上新盘不同步的情况,在SM里面找菜单replace drives,在列表里面找到你插入的新盘选中,执行一下replace,就自动同步了。不知道这个对你有没有帮助。收起
IT咨询服务 · 2014-02-17
浏览2274
HYBTHYBT系统工程师存储技术有限公司
期待高手解答,让菜鸟向你你们学习!哈哈显示全部
期待高手解答,让菜鸟向你你们学习!哈哈收起
IT分销/经销 · 2013-10-12
浏览2230
abit2007abit2007系统工程师代维
回复下,表示我关注过此帖。显示全部
回复下,表示我关注过此帖。收起
互联网服务 · 2013-10-10
浏览2320
yinkyink系统工程师by
这种情况,一般重启。。显示全部
这种情况,一般重启。。收起
互联网服务 · 2013-10-10
浏览2232
woailili9woailili9系统工程师新明星
是啊 学习了  最后怎么解决的呢  兄弟们解决问题后 麻烦到论坛上把解决方法共享下啊 分享精神啊!显示全部
是啊 学习了  最后怎么解决的呢  
兄弟们解决问题后 麻烦到论坛上把解决方法共享下啊 分享精神啊!收起
硬件生产 · 2013-10-09
浏览2199
flm20080704flm20080704系统工程师XXXX
是个复杂问题,不知道最后是怎么处理的。显示全部
是个复杂问题,不知道最后是怎么处理的。收起
IT其它 · 2013-10-03
浏览3055
williswillis技术经理gpos
“鬼盘”的问题,我只能凭经验做些猜测,希望这些思路能给你一定的帮助!1,从故障的cfgPhyList来看,其实0 0000ff 185b7e20应该已经不归阵列管理了,理由:如果还能管理应该有0/142,ispcfgFailDrive命令我是不熟悉的, 用该命令failed脱管磁盘,可以试试用串口在两个控制器都做做。3,你最后...显示全部
“鬼盘”的问题,我只能凭经验做些猜测,希望这些思路能给你一定的帮助!
1,从故障的cfgPhyList来看,其实0 0000ff 185b7e20应该已经不归阵列管理了,理由:如果还能管理应该有0/14
2,ispcfgFailDrive命令我是不熟悉的, 用该命令failed脱管磁盘,可以试试用串口在两个控制器都做做。
3,你最后插上两个磁盘,并设置成热备后,raid恢复,但报错,recovery gnru不知道报什么错,如果报常规的错误,如:raid少盘、热备顶上的什么错误,你可以试试拔掉slot5,等slot12的热备顶上去后,插入新盘(注意是新盘,没有数据、也没有插入到任何阵列的新盘)。将新盘加入到raid里面去。

4,重启阵列也是一个好方法!

5,仔细检查log,找到故障发生的原因。

6,lsi的存储有个特性:每个磁盘都保存的有阵列的信息;如果把在B机做过配置的磁盘,直接拔出来插到A机,总会有些怪问题的~收起
政府机关 · 2012-08-14
浏览3111
冰红茶冰红茶其它digitalchina
:lol建议重启哈显示全部
:lol建议重启哈收起
IT其它 · 2012-08-06
浏览3036
lihuang_520lihuang_520系统运维工程师SOFT
把5号盘换了,14号盘没有换。插5号盘后应该是自动同步,但是不同步,只有把5号盘设置成hotspre 后,才能同步。显示全部
把5号盘换了,14号盘没有换。插5号盘后应该是自动同步,但是不同步,只有把5号盘设置成hotspre 后,才能同步。收起
互联网服务 · 2012-08-02
浏览3214
houzi105houzi105系统工程师@@@
之前到底是12块盘还是13块盘,你最后插入2块盘,是把14号盘拔出,换了一块吗?你插入盘后,为什么要把5号盘和14号盘都设置成hostspare?显示全部
之前到底是12块盘还是13块盘,你最后插入2块盘,是把14号盘拔出,换了一块吗?你插入盘后,为什么要把5号盘和14号盘都设置成hostspare?收起
IT咨询服务 · 2012-08-01
浏览3053

提问者

lihuang_520
系统运维工程师SOFT
擅长领域: 服务器灾备新核心系统

相关问题

问题状态

  • 发布时间:2012-07-31
  • 关注会员:1 人
  • 问题浏览:19372
  • 最近回答:2014-02-17
  • X社区推广