AIX硬盘报错errpt

AIX硬盘报错errpt信息

系统版本:6100-07
使用命令:#errpt | more

A39F8A49   0611123015 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611123015 P H hdisk7         DISK OPERATION ERROR
A39F8A49   0611123015 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611123015 P H hdisk5         DISK OPERATION ERROR
A39F8A49   0611123015 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611123015 P H hdisk7         DISK OPERATION ERROR
A39F8A49   0611123015 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611123015 P H hdisk5         DISK OPERATION ERROR
A39F8A49   0611123015 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611123015 P H hdisk5         DISK OPERATION ERROR
B6267342   0611123015 P H hdisk5         DISK OPERATION ERROR
B6267342   0611123015 P H hdisk5         DISK OPERATION ERROR
B6267342   0611123015 P H hdisk5         DISK OPERATION ERROR
A39F8A49   0611123015 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611123015 P H hdisk5         DISK OPERATION ERROR
A39F8A49   0611123015 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611123015 P H hdisk5         DISK OPERATION ERROR
A39F8A49   0611123015 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611122915 P H hdisk5         DISK OPERATION ERROR
A39F8A49   0611122915 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611122915 P H hdisk7         DISK OPERATION ERROR
A39F8A49   0611122915 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611122915 P H hdisk7         DISK OPERATION ERROR
A39F8A49   0611122915 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611122915 P H hdisk5         DISK OPERATION ERROR
A39F8A49   0611122915 T S syserrlg       ERROR LOGGING BUFFER OVERFLOW
B6267342   0611122915 P H hdisk7         DISK OPERATION ERROR
A39F8A49   0611122915 T S syserrlg       ERROR LOGGING BUFFER OVERFL

发现几乎每分钟都在报错:(

查询具体报错信息:#errpt -a -s 0611123015

LABEL:          SC_DISK_ERR2
IDENTIFIER:     B6267342

Date/Time:       Thu Jun 11 12:30:08 GMT+08:00 2015
Sequence Number: 28928706
Machine Id:      00F73B874C00
Node Id:         720db1
Class:           H
Type:            PERM
WPAR:            Global
Resource Name:   hdisk5         
Resource Class:  disk
Resource Type:   Hitachi
Location:        U78AA.001.WZSGHV9-P1-C5-T1-W50060E8006D5F820-L1000000000000

VPD:            
        Manufacturer................HITACHI
        Machine Type and Model......OPEN-V         
        Part Number.................
        ROS Level and ID............37303036
        Serial Number...............50 0D5F8
        EC Level....................
        FRU Number..................
        Device Specific.(Z0)........00000332EF000002
        Device Specific.(Z1)........001E 4A ....
        Device Specific.(Z2).........
        Device Specific.(Z3).........
        Device Specific.(Z4)...........>
        Device Specific.(Z5)........
        Device Specific.(Z6)........

Description
DISK OPERATION ERROR

Probable Causes
DASD DEVICE

Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
PATH ID
           0
SENSE DATA
0A00 2A00 1164 ABC8 0000 0804 0000 0000 0000 0000 0000 0000 0118 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 00F0 AD8D 0003 FEC0 0000 0000 0000 0000 0000 0000 0000 0003 0000
0000 003D 0017
---------------------------------------------------------------------------
LABEL:          LOST_EVENTS
IDENTIFIER:     A39F8A49

Date/Time:       Thu Jun 11 12:30:08 GMT+08:00 2015
Sequence Number: 28928705
Machine Id:      00F73B874C00
Node Id:         720db1
Class:           S
Type:            TEMP
WPAR:            Global
Resource Name:   syserrlg        

Description
ERROR LOGGING BUFFER OVERFLOW

Probable Causes
EXCESSIVE LOGGING BY SOFTWARE PROGRAM

Install Causes
BUFFER SIZE SET TOO SMALL

        Recommended Actions
        INCREASE BUFFER SIZE

Failure Causes
EXCESSIVE LOGGING BY SOFTWARE PROGRAM

        Recommended Actions
        IDENTIFY OFFENDING SOFTWARE COMPONENT
        CORRECT THEN RETRY OFFENDING SOFTWARE COMPONENT

Detail Data
ERROR ID OF FIRST EVENT DISCARDED
B6267342
ERROR ID OF LAST EVENT DISCARDED
B6267342
NUMBER OF EVENTS DISCARDED
49

这个真心没看太明白,求高手解救,指点0.0:'(

添加一下新查的东西:

#vxdmpadm getsubpaths
NAME         STATE[A]   PATH-TYPE[M] DMPNODENAME  ENCLR-NAME   CTLR   ATTRS
================================================================================
hdisk1       ENABLED(A)   -          disk_0       disk         sas0     -
hdisk0       ENABLED(A)   -          disk_1       disk         sas0     -
hdisk2       ENABLED(A)   -          disk_2       disk         sas0     -
hdisk3       ENABLED(A)   -          disk_3       disk         sas0     -
hdisk4       ENABLED(A)   -          hitachi_r7000_0018 hitachi_r7000 fscsi2   -
hdisk5       ENABLED(A)   -          hitachi_r7000_001e hitachi_r7000 fscsi2   -
hdisk6       ENABLED(A)   -          hitachi_r7000_0024 hitachi_r7000 fscsi2   -
hdisk7       ENABLED(A)   -          hitachi_r7000_002a hitachi_r7000 fscsi2   -
hdisk8       ENABLED(A)   -          hitachi_r7000_0034 hitachi_r7000 fscsi0   -
hdisk9       ENABLED(A)   -          hitachi_r7000_0035 hitachi_r7000 fscsi0   -
hdisk10      ENABLED(A)   -          hitachi_r7000_0036 hitachi_r7000 fscsi0   -

#vxdmpadm getdmpnode
NAME                 STATE        ENCLR-TYPE   PATHS  ENBL  DSBL  ENCLR-NAME  
==============================================================================
hitachi_r7000_001e   ENABLED      Hitachi_R700 1      1     0     hitachi_r7000
hitachi_r7000_002a   ENABLED      Hitachi_R700 1      1     0     hitachi_r7000
hitachi_r7000_0018   ENABLED      Hitachi_R700 1      1     0     hitachi_r7000
hitachi_r7000_0024   ENABLED      Hitachi_R700 1      1     0     hitachi_r7000
hitachi_r7000_0034   ENABLED      Hitachi_R700 1      1     0     hitachi_r7000
hitachi_r7000_0035   ENABLED      Hitachi_R700 1      1     0     hitachi_r7000
hitachi_r7000_0036   ENABLED      Hitachi_R700 1      1     0     hitachi_r7000
disk_0               ENABLED      Disk         1      1     0     disk         
disk_1               ENABLED      Disk         1      1     0     disk         
disk_2               ENABLED      Disk         1      1     0     disk         
disk_3               ENABLED      Disk         1      1     0     disk

#lsattr -El hdisk3
PCM             PCM/friend/scsiscsd                      Path Control Module           False
algorithm       fail_over                                Algorithm                     True
dist_err_pcnt   0                                        Distributed Error Percentage  True
dist_tw_width   50                                       Distributed Error Sample Time True
hcheck_interval 0                                        Health Check Interval         True
hcheck_mode     nonactive                                Health Check Mode             True
max_transfer    0x100000                                 Maximum TRANSFER Size         True
pvid            none                                     Physical volume identifier    False
queue_depth     16                                       Queue DEPTH                   True
reserve_policy  no_reserve                               Reserve Policy                True
size_in_mb      300000                                   Size in Megabytes             False
unique_id       2811350000393B81A18B009MBF2300RC03IBMsas Unique device identifier      False
ww_id           50000393b81a18b0                         World Wide Identifier         False

#Lspath
-bash: Lspath: command not found
[root@720db1 /]#lspath
Enabled hdisk0  sas0
Enabled hdisk1  sas0
Enabled hdisk2  sas0
Enabled hdisk3  sas0
Enabled hdisk4  fscsi0
Enabled hdisk5  fscsi0
Enabled hdisk6  fscsi0
Enabled hdisk7  fscsi0
Enabled hdisk4  fscsi2
Enabled hdisk5  fscsi2
Enabled hdisk6  fscsi2
Enabled hdisk7  fscsi2
Enabled hdisk8  fscsi0
Enabled hdisk9  fscsi0
Enabled hdisk10 fscsi0
Enabled hdisk8  fscsi2
Enabled hdisk9  fscsi2
Enabled hdisk10 fscsi2
Missing hdisk12 fscsi0
Missing hdisk13 fscsi0
Missing hdisk14 fscsi0
Missing hdisk15 fscsi0
Missing hdisk16 fscsi0
Missing hdisk17 fscsi0
Missing hdisk12 fscsi0
Missing hdisk13 fscsi0
Missing hdisk14 fscsi0
Missing hdisk15 fscsi0
Missing hdisk16 fscsi0
Missing hdisk17 fscsi0

好像是lspath和赛门铁克的VXVM冲突。。。。这个东西会引起errpt的报警吗?

参与22

19同行回答

yamazakizhyyamazakizhy系统运维工程师斯普信
回复 11# 北京荣歆咨询 hdisk12-17据说是之前划错了之后删了,不知道为什么会留着这样的信息,但是重启之后还是有那个显示显示全部
回复 11# 北京荣歆咨询
hdisk12-17据说是之前划错了之后删了,不知道为什么会留着这样的信息,但是重启之后还是有那个显示收起
系统集成 · 2015-07-03
浏览4476
yamazakizhyyamazakizhy系统运维工程师斯普信
回复 16# tong2012 可能是为了统一,或者管理方便吧,我们这基本都用的VXVM这个是我们没法改变的-,-显示全部
回复 16# tong2012
可能是为了统一,或者管理方便吧,我们这基本都用的VXVM这个是我们没法改变的-,-收起
系统集成 · 2015-07-03
浏览4345
yamazakizhyyamazakizhy系统运维工程师斯普信
回复 17# lzg21st 试过了删不掉的,提示正在使用,比较忙。。。显示全部
回复 17# lzg21st
试过了删不掉的,提示正在使用,比较忙。。。收起
系统集成 · 2015-07-03
浏览4352
lzg21stlzg21st存储工程师brcb
建议把这些lun在os级别rmdev -dl,然后存储端unexport,然后重新export,os上重新cfgmgr,在用lspath看,每个lun应该有fscsi0和fscsi2才正常显示全部
建议把这些lun在os级别rmdev -dl,然后存储端unexport,然后重新export,os上重新cfgmgr,在用lspath看,每个lun应该有fscsi0和fscsi2才正常收起
银行 · 2015-06-24
浏览4736
tong2012tong2012系统工程师中国航空
SC_DISK_ERR2  盘有问题了吧。AIX上怎么装了个VXVM的卷管理软件? AIX的卷管理已经很好用了吧?平时都是在linux 或者solaris 上用VXVM; 这里是基于什么需求在AIX上装VXVM的?显示全部
SC_DISK_ERR2  盘有问题了吧。

AIX上怎么装了个VXVM的卷管理软件? AIX的卷管理已经很好用了吧?平时都是在linux 或者solaris 上用VXVM; 这里是基于什么需求在AIX上装VXVM的?收起
系统集成 · 2015-06-17
浏览4603
abit2007abit2007系统工程师代维
使用多路径软件看存储的盘状态,可以的话再在存储上看日志。显示全部
使用多路径软件看存储的盘状态,可以的话再在存储上看日志。收起
互联网服务 · 2015-06-17
浏览4418
zcomezcome系统工程师zzz
从报错上看,就是磁盘锁问题,要不就是配置有问题,要不就是有什么在访问有锁的磁盘,因为报错太多,所以导致log日志溢出。显示全部
从报错上看,就是磁盘锁问题,要不就是配置有问题,要不就是有什么在访问有锁的磁盘,因为报错太多,所以导致log日志溢出。收起
IT咨询服务 · 2015-06-16
浏览4596
fly0176fly0176IT顾问新明星
非本地盘故障,看存储显示全部
非本地盘故障,看存储收起
系统集成 · 2015-06-16
浏览5114
上海比佛上海比佛系统架构师上海比佛信息有限公司
你需要注意查看一下你的FC盘SAS盘以及存储上的做了什么配置,造成弹出错误,同时你磁盘上面的属性有没有更改,你需要多方面去分析导致错误原因!显示全部
你需要注意查看一下你的FC盘SAS盘以及存储上的做了什么配置,造成弹出错误,同时你磁盘上面的属性有没有更改,你需要多方面去分析导致错误原因!收起
互联网服务 · 2015-06-15
浏览4474
北京荣歆咨询北京荣歆咨询系统架构师北京荣歆咨询有限公司
前面是FC盘hdisk5和hdisk7的报错,后面你为什么用lsattr只看内置SAS盘hdisk3的信息?貌似和内置盘没关系。hdisk12-17是怎么回事?原来有后来又删过吗,在SAN存储上改过配置吧。显示全部
前面是FC盘hdisk5和hdisk7的报错,后面你为什么用lsattr只看内置SAS盘hdisk3的信息?貌似和内置盘没关系。
hdisk12-17是怎么回事?原来有后来又删过吗,在SAN存储上改过配置吧。收起
IT咨询服务 · 2015-06-14
浏览6285

提问者

yamazakizhy
系统运维工程师斯普信
擅长领域: 服务器AIXUnix

相关问题

相关文章

问题状态

  • 发布时间:2015-06-11
  • 关注会员:3 人
  • 问题浏览:24077
  • 最近回答:2015-07-03
  • X社区推广