IT分销/经销存储IBMds4300

IBM存储DS4300报Unreadable sector(s) detected错误

最近发现小机报LVM的坏块的错误(很多这样的错误)
#errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
80D3764C   1010155911 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS
613E5F38   1010155911 P H LVDD           I/O ERROR DETECTED BY LVM
B0E69588   1010155911 P H hdisk2         ARRAY OPERATION ERROR


#errpt -a
---------------------------------------------------------------------------
LABEL:          LVM_BBFAIL
IDENTIFIER:     80D3764C
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28508
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            UNKN
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
PV NO LONGER RELOCATING NEW BAD BLOCKS
Probable Causes
NON-MEDIA ERROR DURING SW RELOCATION
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
STORAGE DEVICE CABLE
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
MAJOR/MINOR DEVICE NUMBER
8000 0019 0000 0003
BLOCK NUMBER
            1700650408
ERROR CODE AS DEFINED IN sys/errno.h
         110
SENSE DATA
00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6 0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_IO_FAIL
IDENTIFIER:     613E5F38
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28507
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
I/O ERROR DETECTED BY LVM
Probable Causes
POWER, DRIVE, ADAPTER, OR CABLE FAILURE
Recommended Actions
RUN DIAGNOSTICS AGAINST THE FAILING DEVICE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0019 0000 0003
ERROR CODE AS DEFINED IN sys/errno.h
         110
BLOCK NUMBER
            1700650408
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 0064 0000 0069
PHYSICAL BUFFER TRANSACTION TIME
                    21
SENSE DATA
0000 0000 000C ABBB 00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6
0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR1
IDENTIFIER:     B0E69588
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28506
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   hdisk2         
Resource Class:  disk
Resource Type:   array
Location:        U7879.001.DQD1619-P1-C1-T1-W200400A0B8174D3B-L0
Description
ARRAY OPERATION ERROR
Probable Causes
ARRAY DASD MEDIA
Failure Causes
ARRAY DASD MEDIA
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2800 655D DDA8 0000 1004 0000 0000 0000 0000 0020 3A1C 0102 0000 F000 0310
E4FA 2E98 0000 0000 1100 1600 0000 8000 0200 1100 0000 8006 1580 0500 0000 6000
0002 5102 5628 0065 5DDD A800 0010 0400 0000 3154 3434 3737 3333 3633 2020 2020
2020 0612 0300 0000 0100 0700 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 C153 44E5 3130 3039 3131 2F32 3332 3234 3600 0000 0000 0000 0000 0101
0101 0101 10D5 E000 F705 3207 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000


用SM连上存储后看到如下两个ERROR
1、Degraded Logical Drive
2、Unreadable Sector(s) Detected
且存储的第4块盘亮黄灯

更换存储上报警的硬盘后,重新检测,还有一个报错:Unreadable sector(s) detected

且DS4300存储前面板左上角的警告灯还亮(新换的硬盘灯已经正常了),且小机仍然会报那个LVM错误

通过SM里的恢复坏道菜单,看到如下结果:
Logical Drive  LUN  Accessible By  Date/Time         Logical Drive LBA  Drive Location       Drive LBA   Failure Type  
gagzhou        0    Default Group  11-9-28 15:53:03  0x109d523          Enclosure 0, Slot 4  0x2c4e23    Logical      
gagzhou        0    Default Group  11-9-28 15:52:58  0x109d5a3          Enclosure 0, Slot 5  0x2c4e23    Physical      
gagzhou        0    Default Group  11-9-23 10:25:24  0x655dddae         Enclosure 0, Slot 4  0x10e4fa2e  Logical      
gagzhou        0    Default Group  11-9-23 7:49:41   0x655dde2e         Enclosure 0, Slot 5  0x10e4fa2e  Physical      
备注:存储的第4块硬盘是新换的硬盘

以上信息是不是就是指存储的第4块盘有逻辑坏道,第5块盘有物理坏道,这些坏道是不是得通过SM软件的相应菜单里clear掉(我想,逻辑坏道应该可以清除,但物理坏道就不知道能不能清除了),还是得把第5块盘也换掉,使之变成逻辑坏道后才能一起clear掉。

因为以前没处理过这样的事情,请高手指教!谢谢!
参与23

15同行回答

yueyue205yueyue205  系统工程师 , 国际商业机器
正常报出来的,physical的要换盘,logical类型的清掉,你这个情况就是直接换Enclosure 0, Slot 5 ,然后跑个脚本全清掉就行了。脚本:clear allLogicalDrives unreadableSectors;记得分号不要落下哈显示全部
正常报出来的,physical的要换盘,logical类型的清掉,你这个情况就是直接换Enclosure 0, Slot 5 ,然后跑个脚本全清掉就行了。脚本:clear allLogicalDrives unreadableSectors;
记得分号不要落下哈收起
系统集成 · 2011-10-20
浏览8913
myciciymyciciy  IT顾问 , 某金融科技公司
把Slot 5上的硬盘也换了呢显示全部
把Slot 5上的硬盘也换了呢收起
银行 · 2011-10-20
浏览7550
yang3518yang3518  系统工程师 , IBM长沙分公司
应该有一个硬盘坏了, lsvg -p rootvg或者别的vg就可以看到了显示全部
应该有一个硬盘坏了, lsvg -p rootvg或者别的vg就可以看到了收起
互联网服务 · 2012-04-23
浏览6686
jideainiddjideainidd  系统运维工程师 , 银信
解决了 直接点clear "unreadable sector"提示消除。显示全部
解决了 直接点clear "unreadable sector"提示消除。收起
互联网服务 · 2012-04-20
浏览6873
  • 我这DS4300 也出现了这样的问题,但你执行 clear "unreadable sector" 它,只是将告警消除了吧? 真正是否因为坏道 而影响数据 呢?
    2016-03-25
  • [此评论已删除]
    2016-11-07
mophismophis  软件开发工程师 , 杭州
单个磁盘错误,不影响阵列运行呀,直接替换坏磁盘就行,何必考虑到sector?显示全部
单个磁盘错误,不影响阵列运行呀,直接替换坏磁盘就行,何必考虑到sector?收起
互联网服务 · 2011-10-31
浏览6636
zhicxzhicx  软件开发工程师 , 南京铁马
小弟,飘过显示全部
小弟,飘过收起
互联网服务 · 2011-10-31
浏览6575
yuanyiyuanyi  软件开发工程师 , 昆明市
受益,不知道行不行,如果解决了的话接个贴,显示全部
受益,不知道行不行,如果解决了的话接个贴,收起
互联网服务 · 2011-10-25
浏览6629
shawsurgeshawsurge  工程师 , shaw
disk media errors, I know EMC disks can recovery these kinds of errors by re-assign a reserved sector to the bad sector, for IBM DS4K, maybe have the same method.显示全部
disk media errors, I know EMC disks can recovery these kinds of errors by re-assign a reserved sector to the bad sector, for IBM DS4K, maybe have the same method.收起
IT分销/经销 · 2011-10-25
浏览10665
ncllynclly  数据库管理员 , 南昌鸿跃科技有限公司
串口还没连过存储呢?有机会要去学习一下显示全部
串口还没连过存储呢?有机会要去学习一下收起
IT分销/经销 · 2011-10-25
浏览10709
myciciymyciciy  IT顾问 , 某金融科技公司
用串口啊显示全部
用串口啊收起
银行 · 2011-10-21
浏览10902

提问者

nclly
数据库管理员南昌鸿跃科技有限公司
擅长领域: 服务器存储AIX

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2011-10-20
  • 关注会员:1 人
  • 问题浏览:43078
  • 最近回答:2012-04-23
  • X社区推广