IT分销/经销

求救——一台 P570 突然宕机

今天 我们的 tsm 服务起不来了  是一台 P570  突然宕机  报错信息如下
# errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
A6DF45AA   0301115110 I O RMCdaemon      The daemon is started.
AA8AB241   0301115110 T O OPERATOR       OPERATOR NOTIFICATION
BC3BE5A3   0301115110 P S SRC            SOFTWARE PROGRAM ERROR
2BFA76F6   0301114910 T S SYSPROC        SYSTEM SHUTDOWN BY USER
9DBCFDEE   0301115110 T O errdemon       ERROR LOGGING TURNED ON
192AC071   0301112010 T O errdemon       ERROR LOGGING TURNED OFF
DE3B8540   0227010010 P H hdisk5         PATH HAS FAILED
DE3B8540   0225010010 P H hdisk5         PATH HAS FAILED
DE3B8540   0223010010 P H hdisk5         PATH HAS FAILED
C43F90ED   0222061210 P H hdisk3         SUBSYSTEM COMPONENT FAILURE
C43F90ED   0222031810 P H hdisk9         SUBSYSTEM COMPONENT FAILURE
DE3B8540   0215010010 P H hdisk5         PATH HAS FAILED
DE3B8540   0211010010 P H hdisk5         PATH HAS FAILED
DE3B8540   0210010010 P H hdisk5         PATH HAS FAILED
DE3B8540   0208010010 P H hdisk5         PATH HAS FAILED

# errpt -aj DE3B8540 | more
---------------------------------------------------------------------------
LABEL:          SC_DISK_ERR7
IDENTIFIER:     DE3B8540
Date/Time:       Sat Feb 27 01:00:32 GMT+08:00 2010
Sequence Number: 1238
Machine Id:      00CFCF234C00
Node Id:         czqas
Class:           H
Type:            PERM
WPAR:            Global
Resource Name:   hdisk5         
Resource Class:  disk
Resource Type:   mpioapdisk
Location:        U789D.001.DQD45HD-P1-C2-T1-W201500A0B8476EFA-L3000000000000
VPD:            
        Manufacturer................IBM     
        Machine Type and Model......1815      FAStT
        ROS Level and ID............30393134
        Serial Number...............
        Device Specific.(Z0)........0000053245004032
        Device Specific.(Z1)........
Description
PATH HAS FAILED
Probable Causes
ADAPTER HARDWARE OR CABLE
DASD DEVICE
Failure Causes
UNDETERMINED
        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES
        CHECK PATH
Detail Data
PATH ID
           0
SENSE DATA
0A00 2A00 0523 3BD0 0000 0804 0000 0000 0000 0000 0000 0000 0102 0000 0000 0000
Standard input


---------------------------------------------------------------------------
LABEL:          SC_DISK_PCM_ERR1
IDENTIFIER:     C43F90ED
Date/Time:       Mon Feb 22 06:12:03 GMT+08:00 2010
Sequence Number: 1235
Machine Id:      00CFCF234C00
Node Id:         czqas
Class:           H
Type:            PERM
WPAR:            Global
Resource Name:   hdisk3         
Resource Class:  disk
Resource Type:   mpioapdisk
Location:        U789D.001.DQD45HD-P1-C2-T1-W201500A0B8476EFA-L1000000000000
VPD:            
        Manufacturer................IBM     
        Machine Type and Model......1815      FAStT
        ROS Level and ID............30393134
        Serial Number...............
        Device Specific.(Z0)........0000053245004032
        Device Specific.(Z1)........
Description
SUBSYSTEM COMPONENT FAILURE
Probable Causes
ARRAY DASD MEDIA
POWER OR FAN COMPONENT
Failure Causes
ARRAY DASD MEDIA
POWER OR FAN COMPONENT
        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
PATH ID
           2
SENSE DATA
0600 0308 0000 FF04 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 7000 0600




errpt -aj 192AC071 | more
---------------------------------------------------------------------------
LABEL:          ERRLOG_OFF
IDENTIFIER:     192AC071
Date/Time:       Mon Mar  1 11:20:08 GMT+08:00 2010
Sequence Number: 1239
Machine Id:      00CFCF234C00
Node Id:         czqas
Class:           O
Type:            TEMP
WPAR:            Global
Resource Name:   errdemon        
Description
ERROR LOGGING TURNED OFF
Probable Causes
ERRSTOP COMMAND
User Causes
ERRSTOP COMMAND
        Recommended Actions
        RUN ERRDEAD COMMAND
        TURN ERROR LOGGING ON



# errpt -aj 9DBCFDEE | more
---------------------------------------------------------------------------
LABEL:          ERRLOG_ON
IDENTIFIER:     9DBCFDEE
Date/Time:       Mon Mar  1 11:51:07 GMT+08:00 2010
Sequence Number: 1240
Machine Id:      00CFCF234C00
Node Id:         czqas
Class:           O
Type:            TEMP
WPAR:            Global
Resource Name:   errdemon        
Description
ERROR LOGGING TURNED ON
Probable Causes
ERRDEMON STARTED AUTOMATICALLY
User Causes
/USR/LIB/ERRDEMON COMMAND
        Recommended Actions
        NONE


# errpt -aj 2BFA76F6 | more
---------------------------------------------------------------------------
LABEL:          REBOOT_ID
IDENTIFIER:     2BFA76F6
Date/Time:       Mon Mar  1 11:49:49 GMT+08:00 2010
Sequence Number: 1241
Machine Id:      00CFCF234C00
Node Id:         czqas
Class:           S
Type:            TEMP
WPAR:            Global
Resource Name:   SYSPROC         
Description
SYSTEM SHUTDOWN BY USER
Probable Causes
SYSTEM SHUTDOWN
Detail Data
USER ID
           0
0=SOFT IPL 1=HALT 2=TIME REBOOT
           1
TIME TO REBOOT (FOR TIMED REBOOT ONLY)
           0

# errpt -aj BC3BE5A3 | more
---------------------------------------------------------------------------
LABEL:          SRC_SVKO
IDENTIFIER:     BC3BE5A3
Date/Time:       Mon Mar  1 11:51:21 GMT+08:00 2010
Sequence Number: 1243
Machine Id:      00CFCF234C00
Node Id:         czqas
Class:           S
Type:            PERM
WPAR:            Global
Resource Name:   SRC            
Description
SOFTWARE PROGRAM ERROR
Probable Causes
APPLICATION PROGRAM
Failure Causes
SOFTWARE PROGRAM
        Recommended Actions
        MANUALLY RESTART SUBSYSTEM IF NEEDED
Detail Data
SYMPTOM CODE
         256
SOFTWARE ERROR CODE
       -9017
ERROR CODE
           0
DETECTING MODULE
[email=]'srchevn.c'@line:'376'[/email]
FAILING MODULE
named


# errpt -aj AA8AB241 | more
---------------------------------------------------------------------------
LABEL:          OPMSG
IDENTIFIER:     AA8AB241
Date/Time:       Mon Mar  1 11:51:33 GMT+08:00 2010
Sequence Number: 1244
Machine Id:      00CFCF234C00
Node Id:         czqas
Class:           O
Type:            TEMP
WPAR:            Global
Resource Name:   OPERATOR        
Description
OPERATOR NOTIFICATION
User Causes
ERRLOGGER COMMAND
        Recommended Actions
        REVIEW DETAILED DATA
Detail Data
MESSAGE FROM ERRLOGGER COMMAND
Mon Mar 1 11:51:33 GMT+08:00 2010 SMagent started.



# errpt -aj A6DF45AA | more
---------------------------------------------------------------------------
LABEL:          RMCD_INFO_0_ST
IDENTIFIER:     A6DF45AA
Date/Time:       Mon Mar  1 11:51:35 GMT+08:00 2010
Sequence Number: 1245
Machine Id:      00CFCF234C00
Node Id:         czqas
Class:           O
Type:            INFO
WPAR:            Global
Resource Name:   RMCdaemon      
Description
The daemon is started.
Probable Causes
The Resource Monitoring and Control daemon has been started.
User Causes
The startsrc -s ctrmc command has been executed or
the rmcctrl -s command has been executed.
        Recommended Actions
        Confirm that the daemon should be started.
Detail Data
DETECTING MODULE
RSCT,rmcd.c,1.62,213                          
ERROR ID
6eKora05bnW9/nKR/P.U/8....................
REFERENCE CODE
参与38

38同行回答

rainboy_whrainboy_wh系统架构师华迪计算机集团有限公司
如果要找P570宕机原因,直接Call IBM 800,没有过保的话。如果是TSM起不来,su - 到TSM用户,切换到配置文件所在目录,手工执行dsmserv启动TSM,看看报什么错误。显示全部
如果要找P570宕机原因,直接Call IBM 800,没有过保的话。

如果是TSM起不来,su - 到TSM用户,切换到配置文件所在目录,手工执行dsmserv启动TSM,看看报什么错误。收起
系统集成 · 2010-03-01
浏览903
xvjian2005xvjian2005系统管理员丰益信息技术有限公司
TSM起不来显示全部
TSM起不来收起
IT分销/经销 · 2010-03-01
浏览949
rainboy_whrainboy_wh系统架构师华迪计算机集团有限公司
你现在想解决什么问题?找P570宕机原因,还是TSM起不来?显示全部
你现在想解决什么问题?找P570宕机原因,还是TSM起不来?收起
系统集成 · 2010-03-01
浏览935
zp_ccczp_ccc高级技术主管国内某金融科技公司
TSM服务起不来,找TSM相关日志显示全部
TSM服务起不来,找TSM相关日志收起
互联网服务 · 2010-03-01
浏览982
xvjian2005xvjian2005系统管理员丰益信息技术有限公司
那些相关日志?显示全部
那些相关日志?收起
IT分销/经销 · 2010-03-01
浏览880
xvjian2005xvjian2005系统管理员丰益信息技术有限公司
# lsvg -p sapdbvg0516-010 : Volume group must be varied on; use varyonvg command.# varyonvg sapdbvg0516-013 varyonvg: The volume group cannot be varied on because        there are no good copies of the descriptor area.显示全部
# lsvg -p sapdbvg
0516-010 : Volume group must be varied on; use varyonvg command.
# varyonvg sapdbvg
0516-013 varyonvg: The volume group cannot be varied on because
        there are no good copies of the descriptor area.收起
IT分销/经销 · 2010-03-01
浏览927
freedomjiangfreedomjiang软件开发工程师AIX
5# rainboy_wh lsdev -Cc disk 查看 这两个报错的hdisk状态是否可用,如果不可用需要接到你的存储上看看是不是存储坏了,还是光纤线断了?显示全部
5# rainboy_wh


lsdev -Cc disk
查看 这两个报错的hdisk状态是否可用,如果不可用需要接到你的存储上看看是不是存储坏了,还是光纤线断了?收起
互联网服务 · 2010-03-01
浏览949
zp_ccczp_ccc高级技术主管国内某金融科技公司
查查磁盘阵列显示全部
查查磁盘阵列收起
互联网服务 · 2010-03-01
浏览920
xvjian2005xvjian2005系统管理员丰益信息技术有限公司
# lspvhdisk4          00cfcf23e2077127                    sapdbvg         hdisk5          ...显示全部
# lspv
hdisk4          00cfcf23e2077127                    sapdbvg         
hdisk5          00cfcf23e20771f9                    sapdbvg         
hdisk0          00cfcf238d0641e7                    rootvg          active
hdisk1          00cfcf238d30657d                    rootvg          active
hdisk6          00cfcf23e20772ad                    sapdbvg         
hdisk7          00cfcf23e207735f                    sapdbvg         
hdisk2          00cfcf2392a536de                    sapvg           active
hdisk3          00cfcf2392a04420                    sapvg           active
hdisk8          00cfcf23f17a4e14                    sapdblogvg      
hdisk9          00cfcf23f17a4edc                    sapdblogvg收起
IT分销/经销 · 2010-03-01
浏览1840
happy1happy1系统架构师git
哦,那是前两天的报错。最近的报错就是2BFA76F6   0301114910 T S SYSPROC        SYSTEM SHUTDOWN BY USER9DBCFDEE   0301115110 T O errdemon       ERROR LOGGING TURNED ON192AC071  &nb...显示全部
哦,那是前两天的报错。

最近的报错就是
2BFA76F6   0301114910 T S SYSPROC        SYSTEM SHUTDOWN BY USER
9DBCFDEE   0301115110 T O errdemon       ERROR LOGGING TURNED ON
192AC071   0301112010 T O errdemon       ERROR LOGGING TURNED OFF

检查其他相关日志吧,hmc的操作记录等。收起
互联网服务 · 2010-03-01
浏览1686

提问者

xvjian2005
系统管理员丰益信息技术有限公司

问题状态

  • 发布时间:2010-03-01
  • 关注会员:0 人
  • 问题浏览:26559
  • 最近回答:2010-03-03
  • X社区推广