请教LVM 坏块问题(DS4300存储)

最近发现小机报LVM的坏块的错误
#errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
80D3764C   1010155911 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS
613E5F38   1010155911 P H LVDD           I/O ERROR DETECTED BY LVM
B0E69588   1010155911 P H hdisk2         ARRAY OPERATION ERROR
80D3764C   1010154311 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS
613E5F38   1010154311 P H LVDD           I/O ERROR DETECTED BY LVM
B0E69588   1010154311 P H hdisk2         ARRAY OPERATION ERROR
.
.
.
#errpt -a
---------------------------------------------------------------------------
LABEL:          LVM_BBFAIL
IDENTIFIER:     80D3764C
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28508
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            UNKN
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
PV NO LONGER RELOCATING NEW BAD BLOCKS
Probable Causes
NON-MEDIA ERROR DURING SW RELOCATION
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
STORAGE DEVICE CABLE
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
MAJOR/MINOR DEVICE NUMBER
8000 0019 0000 0003
BLOCK NUMBER
            1700650408
ERROR CODE AS DEFINED IN sys/errno.h
         110
SENSE DATA
00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6 0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_IO_FAIL
IDENTIFIER:     613E5F38
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28507
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
I/O ERROR DETECTED BY LVM
Probable Causes
POWER, DRIVE, ADAPTER, OR CABLE FAILURE
Recommended Actions
RUN DIAGNOSTICS AGAINST THE FAILING DEVICE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0019 0000 0003
ERROR CODE AS DEFINED IN sys/errno.h
         110
BLOCK NUMBER
            1700650408
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 0064 0000 0069
PHYSICAL BUFFER TRANSACTION TIME
                    21
SENSE DATA
0000 0000 000C ABBB 00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6
0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR1
IDENTIFIER:     B0E69588
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28506
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   hdisk2         
Resource Class:  disk
Resource Type:   array
Location:        U7879.001.DQD1619-P1-C1-T1-W200400A0B8174D3B-L0
Description
ARRAY OPERATION ERROR
Probable Causes
ARRAY DASD MEDIA
Failure Causes
ARRAY DASD MEDIA
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2800 655D DDA8 0000 1004 0000 0000 0000 0000 0020 3A1C 0102 0000 F000 0310
E4FA 2E98 0000 0000 1100 1600 0000 8000 0200 1100 0000 8006 1580 0500 0000 6000
0002 5102 5628 0065 5DDD A800 0010 0400 0000 3154 3434 3737 3333 3633 2020 2020
2020 0612 0300 0000 0100 0700 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 C153 44E5 3130 3039 3131 2F32 3332 3234 3600 0000 0000 0000 0000 0101
0101 0101 10D5 E000 F705 3207 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_BBFAIL
IDENTIFIER:     80D3764C
Date/Time:       Mon Oct 10 15:43:50 BEIST 2011
Sequence Number: 28505
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            UNKN
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
PV NO LONGER RELOCATING NEW BAD BLOCKS
Probable Causes
NON-MEDIA ERROR DURING SW RELOCATION
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
STORAGE DEVICE CABLE
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
MAJOR/MINOR DEVICE NUMBER
8000 0019 0000 0003
BLOCK NUMBER
            1700650408
ERROR CODE AS DEFINED IN sys/errno.h
         110
SENSE DATA
00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6 0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_IO_FAIL
IDENTIFIER:     613E5F38
Date/Time:       Mon Oct 10 15:43:50 BEIST 2011
Sequence Number: 28504
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
I/O ERROR DETECTED BY LVM
Probable Causes
POWER, DRIVE, ADAPTER, OR CABLE FAILURE
Recommended Actions
RUN DIAGNOSTICS AGAINST THE FAILING DEVICE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0019 0000 0003
ERROR CODE AS DEFINED IN sys/errno.h
         110
BLOCK NUMBER
            1700650408
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 0064 0000 0069
PHYSICAL BUFFER TRANSACTION TIME
                    20
SENSE DATA
0000 0000 000C ABBB 00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6
0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR1
IDENTIFIER:     B0E69588
Date/Time:       Mon Oct 10 15:43:50 BEIST 2011
Sequence Number: 28503
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   hdisk2         
Resource Class:  disk
Resource Type:   array
Location:        U7879.001.DQD1619-P1-C1-T1-W200400A0B8174D3B-L0
Description
ARRAY OPERATION ERROR
Probable Causes
ARRAY DASD MEDIA
Failure Causes
ARRAY DASD MEDIA
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2800 655D DDA8 0000 1004 0000 0000 0000 0000 0020 33A5 0102 0000 F000 0310
E4FA 2E98 0000 0000 1100 1600 0000 8000 0200 1100 0000 8006 1580 0500 0000 6000
0002 5102 5628 0065 5DDD A800 0010 0400 0000 3154 3434 3737 3333 3633 2020 2020
2020 0612 0300 0000 0100 0700 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 C14F 0F42 3130 3039 3131 2F32 3330 3731 3000 0000 0000 0000 0000 0101
0101 0101 10D5 E000 F705 3207 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_BBFAIL
IDENTIFIER:     80D3764C
Date/Time:       Mon Oct 10 12:57:56 BEIST 2011
Sequence Number: 28502
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            UNKN
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
PV NO LONGER RELOCATING NEW BAD BLOCKS
Probable Causes
NON-MEDIA ERROR DURING SW RELOCATION
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
STORAGE DEVICE CABLE
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
MAJOR/MINOR DEVICE NUMBER
8000 0019 0000 0003
BLOCK NUMBER
            1700650408
ERROR CODE AS DEFINED IN sys/errno.h
         110
SENSE DATA
00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6 0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_IO_FAIL
IDENTIFIER:     613E5F38
Date/Time:       Mon Oct 10 12:57:56 BEIST 2011
Sequence Number: 28501
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
I/O ERROR DETECTED BY LVM
Probable Causes
POWER, DRIVE, ADAPTER, OR CABLE FAILURE
Recommended Actions
RUN DIAGNOSTICS AGAINST THE FAILING DEVICE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0019 0000 0003
ERROR CODE AS DEFINED IN sys/errno.h
         110
BLOCK NUMBER
            1700650408
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 0064 0000 0069
PHYSICAL BUFFER TRANSACTION TIME
                    15
SENSE DATA
0000 0000 000C ABBB 00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6
0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR1
IDENTIFIER:     B0E69588
Date/Time:       Mon Oct 10 12:57:56 BEIST 2011
Sequence Number: 28500
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   hdisk2         
Resource Class:  disk
Resource Type:   array
Location:        U7879.001.DQD1619-P1-C1-T1-W200400A0B8174D3B-L0
Description
ARRAY OPERATION ERROR
Probable Causes
ARRAY DASD MEDIA
Failure Causes
ARRAY DASD MEDIA
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2800 655D DDA8 0000 1004 0000 0000 0000 0000 0020 1855 0102 0000 F000 0310
E4FA 2E98 0000 0000 1100 1600 0000 8000 0200 1100 0000 8006 1580 0500 0000 6000
0002 5102 5628 0065 5DDD A800 0010 0400 0000 3154 3434 3737 3333 3633 2020 2020
2020 0612 0300 0000 0100 0700 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 C130 9936 3130 3039 3131 2F32 3032 3132 3100 0000 0000 0000 0000 0000
0000 0000 10D5 E000 F705 3207 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000
---------------------------------------------------------------------------
后面还有很多

其中hdisk2是DS4300的RAID5出来的盘
看了一下DS4300磁盘阵列,有一块盘亮黄灯

查了相关的文档,说这种错误处理起来特别麻烦,因为hdisk2中有重要的数据,不过一周前做过备份(备份时间很长,要一周),现在应用还在用,不能停

以前也处理过存储亮黄灯的的错误,一般只要换掉那个盘就OK,但上面的这种错误不知道能不能直接换盘,请教指点!!!   感谢!
参与31

29同行回答

sakidodosakidodo系统工程师
看到报警的盘没?显示全部
看到报警的盘没?收起
互联网服务 · 2011-10-17
浏览2106
ncllynclly数据库管理员南昌鸿跃科技有限公司
谢谢LS们的耐心答复,现在到了客户这,用SM连上去后看到如下两个ERROR1、Degraded Logical Drive 2、Unreadable Sectors Detected (4)第一个错误只要换盘就行,第二个错误就不知道怎么弄了(上面没有明确的建议)只有先把坏盘换了再说了,今天晚上换盘...显示全部
谢谢LS们的耐心答复,现在到了客户这,用SM连上去后看到如下两个ERROR
1、Degraded Logical Drive
2、Unreadable Sectors Detected (4)

第一个错误只要换盘就行,第二个错误就不知道怎么弄了(上面没有明确的建议)

只有先把坏盘换了再说了,今天晚上换盘收起
IT分销/经销 · 2011-10-17
浏览2196
yuanyiyuanyi软件开发工程师昆明市
新增一块盘,当问题解决了后再将坏掉的盘取出显示全部
新增一块盘,当问题解决了后再将坏掉的盘取出收起
互联网服务 · 2011-10-12
浏览1241
fly_1203fly_1203系统工程师北京银信长远科技有限公司
胆大心细地干吧,知道自己每一步在干什么就ok了。显示全部
胆大心细地干吧,知道自己每一步在干什么就ok了。收起
互联网服务 · 2011-10-12
浏览1260
colinscolins系统工程师金融行业
在主机层面报错经常不准确;只要你确认是由于存储原因导致的,而且直接换盘不影响那就行了。显示全部
在主机层面报错经常不准确;只要你确认是由于存储原因导致的,而且直接换盘不影响那就行了。收起
银行 · 2011-10-12
浏览1290
bbird006bbird006系统运维工程师OTA
是啊,放一天增加一天风险显示全部
是啊,放一天增加一天风险收起
互联网服务 · 2011-10-11
浏览1239
午夜幽魂午夜幽魂系统运维工程师计算机有限公司
先用SM看看存储里的报错再说吧,有raid的怕什么呀,不是还有hot盘的吗,显示全部
先用SM看看存储里的报错再说吧,有raid的怕什么呀,不是还有hot盘的吗,收起
系统集成 · 2011-10-11
浏览1206
shenadamshenadam系统工程师sjo
这有啥复杂的啊,在阵列里有RAID怕啥啊。做过备份换就是了放一天,风险增加一天!显示全部
这有啥复杂的啊,在阵列里有RAID怕啥啊。做过备份换就是了

放一天,风险增加一天!收起
互联网服务 · 2011-10-11
浏览1169
yuyuluyuyulu系统工程师自由职业
存储已经做有陈列的,而且支持热拨插,放心大胆的做吧,你会做的,我们懂!显示全部
存储已经做有陈列的,而且支持热拨插,放心大胆的做吧,你会做的,我们懂!收起
系统集成 · 2011-10-11
浏览1218
ncllynclly数据库管理员南昌鸿跃科技有限公司
因为以前坏盘不是这样的提示,这是第一次碰到,所以不敢轻意去动,里面有重要数据啊!也担心数据万一丢失了怎么办显示全部
因为以前坏盘不是这样的提示,这是第一次碰到,所以不敢轻意去动,里面有重要数据啊!

也担心数据万一丢失了怎么办收起
IT分销/经销 · 2011-10-11
浏览2578

提问者

nclly
数据库管理员南昌鸿跃科技有限公司
擅长领域: 存储服务器AIX

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2011-10-10
  • 关注会员:2 人
  • 问题浏览:37165
  • 最近回答:2021-01-14
  • X社区推广