请教LVM 坏块问题(DS4300存储)

最近发现小机报LVM的坏块的错误
#errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
80D3764C   1010155911 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS
613E5F38   1010155911 P H LVDD           I/O ERROR DETECTED BY LVM
B0E69588   1010155911 P H hdisk2         ARRAY OPERATION ERROR
80D3764C   1010154311 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS
613E5F38   1010154311 P H LVDD           I/O ERROR DETECTED BY LVM
B0E69588   1010154311 P H hdisk2         ARRAY OPERATION ERROR
.
.
.
#errpt -a
---------------------------------------------------------------------------
LABEL:          LVM_BBFAIL
IDENTIFIER:     80D3764C
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28508
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            UNKN
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
PV NO LONGER RELOCATING NEW BAD BLOCKS
Probable Causes
NON-MEDIA ERROR DURING SW RELOCATION
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
STORAGE DEVICE CABLE
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
MAJOR/MINOR DEVICE NUMBER
8000 0019 0000 0003
BLOCK NUMBER
            1700650408
ERROR CODE AS DEFINED IN sys/errno.h
         110
SENSE DATA
00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6 0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_IO_FAIL
IDENTIFIER:     613E5F38
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28507
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
I/O ERROR DETECTED BY LVM
Probable Causes
POWER, DRIVE, ADAPTER, OR CABLE FAILURE
Recommended Actions
RUN DIAGNOSTICS AGAINST THE FAILING DEVICE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0019 0000 0003
ERROR CODE AS DEFINED IN sys/errno.h
         110
BLOCK NUMBER
            1700650408
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 0064 0000 0069
PHYSICAL BUFFER TRANSACTION TIME
                    21
SENSE DATA
0000 0000 000C ABBB 00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6
0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR1
IDENTIFIER:     B0E69588
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28506
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   hdisk2         
Resource Class:  disk
Resource Type:   array
Location:        U7879.001.DQD1619-P1-C1-T1-W200400A0B8174D3B-L0
Description
ARRAY OPERATION ERROR
Probable Causes
ARRAY DASD MEDIA
Failure Causes
ARRAY DASD MEDIA
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2800 655D DDA8 0000 1004 0000 0000 0000 0000 0020 3A1C 0102 0000 F000 0310
E4FA 2E98 0000 0000 1100 1600 0000 8000 0200 1100 0000 8006 1580 0500 0000 6000
0002 5102 5628 0065 5DDD A800 0010 0400 0000 3154 3434 3737 3333 3633 2020 2020
2020 0612 0300 0000 0100 0700 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 C153 44E5 3130 3039 3131 2F32 3332 3234 3600 0000 0000 0000 0000 0101
0101 0101 10D5 E000 F705 3207 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_BBFAIL
IDENTIFIER:     80D3764C
Date/Time:       Mon Oct 10 15:43:50 BEIST 2011
Sequence Number: 28505
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            UNKN
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
PV NO LONGER RELOCATING NEW BAD BLOCKS
Probable Causes
NON-MEDIA ERROR DURING SW RELOCATION
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
STORAGE DEVICE CABLE
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
MAJOR/MINOR DEVICE NUMBER
8000 0019 0000 0003
BLOCK NUMBER
            1700650408
ERROR CODE AS DEFINED IN sys/errno.h
         110
SENSE DATA
00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6 0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_IO_FAIL
IDENTIFIER:     613E5F38
Date/Time:       Mon Oct 10 15:43:50 BEIST 2011
Sequence Number: 28504
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
I/O ERROR DETECTED BY LVM
Probable Causes
POWER, DRIVE, ADAPTER, OR CABLE FAILURE
Recommended Actions
RUN DIAGNOSTICS AGAINST THE FAILING DEVICE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0019 0000 0003
ERROR CODE AS DEFINED IN sys/errno.h
         110
BLOCK NUMBER
            1700650408
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 0064 0000 0069
PHYSICAL BUFFER TRANSACTION TIME
                    20
SENSE DATA
0000 0000 000C ABBB 00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6
0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR1
IDENTIFIER:     B0E69588
Date/Time:       Mon Oct 10 15:43:50 BEIST 2011
Sequence Number: 28503
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   hdisk2         
Resource Class:  disk
Resource Type:   array
Location:        U7879.001.DQD1619-P1-C1-T1-W200400A0B8174D3B-L0
Description
ARRAY OPERATION ERROR
Probable Causes
ARRAY DASD MEDIA
Failure Causes
ARRAY DASD MEDIA
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2800 655D DDA8 0000 1004 0000 0000 0000 0000 0020 33A5 0102 0000 F000 0310
E4FA 2E98 0000 0000 1100 1600 0000 8000 0200 1100 0000 8006 1580 0500 0000 6000
0002 5102 5628 0065 5DDD A800 0010 0400 0000 3154 3434 3737 3333 3633 2020 2020
2020 0612 0300 0000 0100 0700 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 C14F 0F42 3130 3039 3131 2F32 3330 3731 3000 0000 0000 0000 0000 0101
0101 0101 10D5 E000 F705 3207 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_BBFAIL
IDENTIFIER:     80D3764C
Date/Time:       Mon Oct 10 12:57:56 BEIST 2011
Sequence Number: 28502
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            UNKN
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
PV NO LONGER RELOCATING NEW BAD BLOCKS
Probable Causes
NON-MEDIA ERROR DURING SW RELOCATION
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
STORAGE DEVICE CABLE
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
MAJOR/MINOR DEVICE NUMBER
8000 0019 0000 0003
BLOCK NUMBER
            1700650408
ERROR CODE AS DEFINED IN sys/errno.h
         110
SENSE DATA
00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6 0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_IO_FAIL
IDENTIFIER:     613E5F38
Date/Time:       Mon Oct 10 12:57:56 BEIST 2011
Sequence Number: 28501
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
I/O ERROR DETECTED BY LVM
Probable Causes
POWER, DRIVE, ADAPTER, OR CABLE FAILURE
Recommended Actions
RUN DIAGNOSTICS AGAINST THE FAILING DEVICE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0019 0000 0003
ERROR CODE AS DEFINED IN sys/errno.h
         110
BLOCK NUMBER
            1700650408
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 0064 0000 0069
PHYSICAL BUFFER TRANSACTION TIME
                    15
SENSE DATA
0000 0000 000C ABBB 00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6
0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR1
IDENTIFIER:     B0E69588
Date/Time:       Mon Oct 10 12:57:56 BEIST 2011
Sequence Number: 28500
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   hdisk2         
Resource Class:  disk
Resource Type:   array
Location:        U7879.001.DQD1619-P1-C1-T1-W200400A0B8174D3B-L0
Description
ARRAY OPERATION ERROR
Probable Causes
ARRAY DASD MEDIA
Failure Causes
ARRAY DASD MEDIA
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2800 655D DDA8 0000 1004 0000 0000 0000 0000 0020 1855 0102 0000 F000 0310
E4FA 2E98 0000 0000 1100 1600 0000 8000 0200 1100 0000 8006 1580 0500 0000 6000
0002 5102 5628 0065 5DDD A800 0010 0400 0000 3154 3434 3737 3333 3633 2020 2020
2020 0612 0300 0000 0100 0700 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 C130 9936 3130 3039 3131 2F32 3032 3132 3100 0000 0000 0000 0000 0000
0000 0000 10D5 E000 F705 3207 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000
---------------------------------------------------------------------------
后面还有很多

其中hdisk2是DS4300的RAID5出来的盘
看了一下DS4300磁盘阵列,有一块盘亮黄灯

查了相关的文档,说这种错误处理起来特别麻烦,因为hdisk2中有重要的数据,不过一周前做过备份(备份时间很长,要一周),现在应用还在用,不能停

以前也处理过存储亮黄灯的的错误,一般只要换掉那个盘就OK,但上面的这种错误不知道能不能直接换盘,请教指点!!!   感谢!
参与31

29同行回答

yulu4314yulu4314  技术支持 , 长春
这个先把故障硬件换了,在看看是否还有报警!显示全部

这个先把故障硬件换了,在看看是否还有报警!

收起
系统集成 · 2021-01-14
浏览2577
无何有无何有  系统架构师 , 安徽
raid 5 阵列中同时有两块盘有坏道,会不会出现数据损坏?只是清除日志,未必就解决了问题。显示全部
raid 5 阵列中同时有两块盘有坏道,会不会出现数据损坏?只是清除日志,未必就解决了问题。收起
系统集成 · 2013-06-09
浏览4177
jideainiddjideainidd  系统运维工程师 , 银信
回复 23# nclly     解决了,更换故障盘后, 直接点clear "unreadable sector"提示消除。显示全部
回复 23# nclly


    解决了,更换故障盘后, 直接点clear "unreadable sector"提示消除。收起
互联网服务 · 2012-04-20
浏览4133
jideainiddjideainidd  系统运维工程师 , 银信
回复 5# feidaodao     在吗 我也遇到这个里面的问题了。更换完硬盘 提示 unreadable sector 不知道怎么清除这个报错。显示全部
回复 5# feidaodao


    在吗 我也遇到这个里面的问题了。更换完硬盘 提示 unreadable sector 不知道怎么清除这个报错。收起
互联网服务 · 2012-04-20
浏览4073
jideainiddjideainidd  系统运维工程师 , 银信
回复 23# nclly     我也遇到这个问题了。 我觉得是链路噪音过多 以前的链路噪音应该清除掉就好。可看了看,都是用脚本的清除的。也不知道用哪个脚本好,求指教。显示全部
回复 23# nclly


    我也遇到这个问题了。 我觉得是链路噪音过多 以前的链路噪音应该清除掉就好。可看了看,都是用脚本的清除的。也不知道用哪个脚本好,求指教。收起
互联网服务 · 2012-04-20
浏览4253
wangf15wangf15  技术经理 , 长虹佳华
回复 24# nclly     没遇到过出现坏道的问题,兄弟把解决的过程写一下吧,方便后来人。谢谢显示全部
回复 24# nclly


    没遇到过出现坏道的问题,兄弟把解决的过程写一下吧,方便后来人。
谢谢收起
互联网服务 · 2012-02-02
浏览4097
ncllynclly  数据库管理员 , 南昌鸿跃科技有限公司
请高手指点下,谢谢!显示全部
请高手指点下,谢谢!收起
IT分销/经销 · 2011-10-20
浏览4122
ncllynclly  数据库管理员 , 南昌鸿跃科技有限公司
我贴个坏道的图上来吧,省得看不清楚显示全部
我贴个坏道的图上来吧,省得看不清楚

unreadabled_error_ds4300.jpg

收起
IT分销/经销 · 2011-10-17
浏览4134
ncllynclly  数据库管理员 , 南昌鸿跃科技有限公司
存储上报警的硬盘更换后,重新检测,还有一个报错:Unreadable sector(s) detected且DS4300存储前面板左上角的警告灯还亮(新换的硬盘灯已经正常了)通过SM里的恢复坏道菜单,看到如下结果:Logical Drive  LUN  Accessible By  Date/Time   ...显示全部
存储上报警的硬盘更换后,重新检测,还有一个报错:Unreadable sector(s) detected

且DS4300存储前面板左上角的警告灯还亮(新换的硬盘灯已经正常了)

通过SM里的恢复坏道菜单,看到如下结果:
Logical Drive  LUN  Accessible By  Date/Time         Logical Drive LBA  Drive Location       Drive LBA   Failure Type  
gagzhou        0    Default Group  11-9-28 15:53:03  0x109d523          Enclosure 0, Slot 4  0x2c4e23    Logical      
gagzhou        0    Default Group  11-9-28 15:52:58  0x109d5a3          Enclosure 0, Slot 5  0x2c4e23    Physical      
gagzhou        0    Default Group  11-9-23 10:25:24  0x655dddae         Enclosure 0, Slot 4  0x10e4fa2e  Logical      
gagzhou        0    Default Group  11-9-23 7:49:41   0x655dde2e         Enclosure 0, Slot 5  0x10e4fa2e  Physical      
备注:存储的第4块硬盘是新换的硬盘

以上信息是不是就是指存储的第4块盘有逻辑坏道,第5块盘有物理坏道,这些坏道是不是得通过SM软件的相应菜单里clear掉(我想,逻辑坏道应该可以清除,但物理坏道就不知道能不能清除了),还是得把第5块盘也换掉,使之变成逻辑坏道后才能一起clear掉。

因为以前没处理过这样的事情,请高手指教!谢谢!收起
IT分销/经销 · 2011-10-17
浏览4054
潇潇雨竹潇潇雨竹  系统架构师 , 北京青云科技股份有限公司
谢谢LS们的耐心答复,现在到了客户这,用SM连上去后看到如下两个ERROR1、Degraded Logical Drive 2、Unre ...nclly 发表于 2011-10-17 11:37 换完盘之后第一个错误消失后,估计第二个错误也就消失了:lol 一般这种都是连带的错误...显示全部
谢谢LS们的耐心答复,现在到了客户这,用SM连上去后看到如下两个ERROR
1、Degraded Logical Drive
2、Unre ...
nclly 发表于 2011-10-17 11:37


换完盘之后第一个错误消失后,估计第二个错误也就消失了:lol 一般这种都是连带的错误收起
IT咨询服务 · 2011-10-17
浏览4070

提问者

nclly
数据库管理员南昌鸿跃科技有限公司
擅长领域: 服务器存储AIX

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2011-10-10
  • 关注会员:2 人
  • 问题浏览:36889
  • 最近回答:2021-01-14
  • X社区推广