aix 5.3 系统告警日志请求予以分析

bash-3.2$ errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
A6DF45AA   0812191315 I O RMCdaemon      The daemon is started.
67145A39   0812191215 U S SYSDUMP        SYSTEM DUMP
F48137AC   0812191215 U O minidump       COMPRESSED MINIMAL DUMP
9D035E4D   0812191215 P S SYSVMM         DATA STORAGE INTERRUPT, PROCESSOR
9DBCFDEE   0812191315 T O errdemon       ERROR LOGGING TURNED ON
2F3E09A4   0530124515 I H sys0           REPAIR ACTION
BFE4C025   0529170215 P H sysplanar0     UNDETERMINED ERROR
bash-3.2$ errpt -a
---------------------------------------------------------------------------
LABEL:          RMCD_INFO_0_ST
IDENTIFIER:     A6DF45AA

Date/Time:       Wed Aug 12 19:13:52 CUT 2015
Sequence Number: 993
Machine Id:      00052294D700
Node Id:         ZSOFAPP
Class:           O
Type:            INFO
Resource Name:   RMCdaemon      

Description
The daemon is started.

Probable Causes
The Resource Monitoring and Control daemon has been started.

User Causes
The startsrc -s ctrmc command has been executed or
the rmcctrl -s command has been executed.

        Recommended Actions
        Confirm that the daemon should be started.

Detail Data
DETECTING MODULE
RSCT,rmcd.c,1.51,209                          
ERROR ID
6eKora0kftmJ/ge4/16m3g0...................
REFERENCE CODE

---------------------------------------------------------------------------
LABEL:          DUMP_STATS
IDENTIFIER:     67145A39

Date/Time:       Wed Aug 12 19:12:54 CUT 2015
Sequence Number: 991
Machine Id:      00052294D700
Node Id:         ZSOFAPP
Class:           S
Type:            UNKN
Resource Name:   SYSDUMP         

Description
SYSTEM DUMP

Probable Causes
UNEXPECTED SYSTEM HALT

User Causes
SYSTEM DUMP REQUESTED BY USER

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES

Failure Causes
UNEXPECTED SYSTEM HALT

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
DUMP DEVICE
/dev/lg_dumplv
DUMP SIZE
             509769728
TIME
Wed Aug 12 19:10:05 2015
DUMP TYPE (1 = PRIMARY, 2 = SECONDARY)
           0
DUMP STATUS
           0
ERROR CODE
           0
DUMP INTEGRITY
Compressed dump - Run dmpfmt with -c flag                                 on dump after uncompressing.
FILE NAME

PROCESSOR ID
           2
---------------------------------------------------------------------------
LABEL:          MINIDUMP_LOG
IDENTIFIER:     F48137AC

Date/Time:       Wed Aug 12 19:12:34 CUT 2015
Sequence Number: 990
Machine Id:      00052294D700
Node Id:         ZSOFAPP
Class:           O
Type:            UNKN
Resource Name:   minidump        

Description
COMPRESSED MINIMAL DUMP

Probable Causes
System dumped. Minimal Dump collected in Non-Volatile Memory.

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
Minidump Data:
4D32 0A73 1B28 0037 0035 003B 0032 0058 0000 0000 1E62 7800 0000 0000 82B1 200B
0000 0003 4000 0002 55CB 9A5A 28C3 9547 0165 6E64 0074 6100 0550 C851 8C72 273D
DCC6 C400 0200 6563 DDBA 0108 0040 0180 0555 9669 6A00 A0A1 C387 1005 0060 E800
068D 1630 7060 84D1 6206 0B18 005E 9029 63E7 059B 335F C8D4 6903 878D 1D65 6345
A4C0 8801 2000 002C 5596 692A 00A0 218E 8610 234A 6CD8 6980 9726 53B2 4CB1 D2A4
0988 8920 232A 90F8 E79F 4968 21D9 8034 0465 6300 3E04 2093 660E 9C30 74C6 A059
7163 060E 0010 2312 B042 0580 A121 4F9A 4001 1060 0481 8820 0580 0CD0 081E 9C91
4A40 C189 C711 0084 0C20 6302 6019 0000 8B66 F010 D174 9981 0220 9932 7F02 1D0A
F101 D188 4254 9020 B493 85B3 8F31 098C F001 6000 1A3A 8E44 4013 B513 4207 5940
6980 3B0A 3140 8054 C080 FE6B 8A73 664B AF60 591E 300A E021 5B78 43D7 B6BC 8997
2CC7 00C9 D2FA 8DD8 F429 00A1 1121 8025 2B42 2921 A220 0410 3488 50E1 0A22 301E
46E5 4222 6683 6904 0214 2800 A02F 4404 0B86 06A8 16B3 43AA 7E3B 5F50 5119 3300
8411 000A 381A 47E1 00B8 4742 516C 00D5 12E4 C48A 236F E7DE DDBB 9F1D A108 2040
1C70 F4CF BFEB D086 B201 6AA8 B6F2 E4B8 75F3 3EE0 4F5F F00D A623 761A E0A5 89F7
F0CC 1108 F800 BD03 8406 31D7 B77F BF9C 37EA 43F5 4170 804C B6C1 370E 3EE8 34F2
0648 1D80 9000 7505 A0E1 C104 3E88 C006 7462 6C74 4000 3318 E017 49EF 8080 126D
2071 D00C 383B 41C4 4867 1109 500E 3E27 01D5 D551 0CEC F4C0 75FF 7C08 9860 1159
100B 3785 7D64 DA0B F4D8 51DB 8E23 3522 CF60 0D88 C289 296C 81C3 4044 0F48 0781
4883 11B8 E35D 6ED5 F4D2 5078 C404 0461 7B9D 3825 5043 16D9 A54D 6622 0611 248B
C544 1744 8408 0202 2283 F948 1C48 3E72 03C0 10D4 C914 686D EF05 9965 5932 6149
6055 1B7A 04D2 080A D061 C88D D7CD F34F 3FE9 0590 528C 31B9 1911 2085 89D8 154C
87C5 0489 0C3A 6603 CCA8 0688 08C0 A910 4120 83A7 A716 C641 4CDE B4E2 CB3B 20E5
BAEB A131 412A E948 01AC 6246 4C53 5081 8A4C 3420 33D2 8D3A EDE5 0C08 5095 8541
286B 7A35 4B6D 1880 E20F B0C4 96C3 48B8 9A95 1580 AAB4 CE5A E217 3080 4404 089E
C624 8400 7784 9106 1D70 C8F1 C618 2BD0 9043 B912 A980 40BD F7E6 BBEF 0A32 D430
844C 049C C08C C163 94E1 061D 72E4 B142 0CED C654 4123 3088 465A 7A65 B919 000B
09B8 5A96 026A F058 160C 27F4 47C1 02D1 3411 9C74 00C4 1013 0B84 9090 AE4C A981
B413 4B1C 0153 C23A 98D4 C6B2 CB0B 7C93 4370 2647 25F0 87DD 960A 12AC 1F1E 2D1E
0512 AC51 C2CC 1091 1651 0049 90D0 3447 5633 2701 1CDA 4414 DDD8 4705 5036 6F12
CC71 0474 1064 0C2E A0BD EACA 6B44 BEEE 0D51 DF79 FFCA B7DE 81FB 0D00 E083 FF8A
37B8 8C37 7E14 018D 56DB 7532 B498 06C3 0EF3 8CF5 F5A6 40F5 1CD1 98A5 4574 F93D
F142 446B 9C44 9995 CEAA 0078 3800 2FBA 1CB9 FA50 3BC9 D009 1923 85A0 8D03 7896
5501 2941 0C35 684C 96EF 407A 6D80 D08C 2800 85A4 6964 E7B5 7752 4698 87CA 6554
00F4 C834 8514 A5BB 3517 0401 DCB2 A6ED B80F 75BA 5F80 1021 028B 1035 AD84 A211
51C2 4419 707C 2106 1BFB AEF1 051D 68C8 5146 1864 58C1 0C72 4003 9914 2019 B0D8
5FFF FE47 86FD CD81 0D65 A09F 0065 60B7 8814 2016 D403 C90D F8E1 B1D0 8124 0AE0
D841 4CA4 0080 1F00 4572 00D8 001C 1674 3509 B0E1 1533 0303 500A B00C 1E78 4A31
7EF9 1944 0400 0418 6C42 262A 64A1 D9DE F004 A611 457E 5023 85D4 2202 A7C1 04D1
6512 8843 06B8 969B 9184 6D6C 4F6C E11D 5EA0 3608 B08D 2859 345B 1E3E 4137 BB15
E00C DB28 C738 C880 010C 69E8 4F03 B01E F8C4 E73C 6009 2001 2E01 0028 2810 0124
00A5 2659 4A0D A006 B4C3 4B84 021E 38BA 4E3F 88B1 2DC7 4144 0143 C123 5214 C036
048C A900 91FB 23A5 FE61 294C 8D88 531F 424C 0230 B02C 47FE 3100 F960 9D97 32D0
AA3F CA64 4C85 4100 AE08 9738 C301 EB04 90C0 0206 8865 2C64 298B 59CE FA1A B40A
0305 C905 0003 A9C8 5607 6AC1 2D54 7CAB 7101 1040 01C6 F535 6902 CC2C A94C 979B
38C0 2E90 0801 5E47 A901 FC6C 9233 82E1 4B5F FC9A 4111 2A08 1102 A400 0A10 9318
C52C 8631 996C AC63 A309 DDD5 1040 8635 74F1 8BAA 81C2 0A5C 8600 3394 A28C 40C1
99CE 4C85 AA98 780E 223A 0480 0080 6106 4678 2A00 0225 681A F661 C484 E60C 6AA5
741C 4607 DA42 3BFC 818A 5E2B CB15 6B93 D116 EE21 11FF 3CD4 48A1 D887 6220 9471
8BFB 1B2D 752A 389E 1A0E 713E 2D9C 506B 0947 531A D571 06C8 2459 0260 096E 646A
5372 B100 1426 4104 50BA 840B 20F3 C002 6409 1241 9CC3 5389 5892 4C97 F413 5781
8E2C 1680 000D BA72 8729 4575 AA44 C047 6D0A F08C 9868 95AB 273C CA00 9CB1 1164
2101 086F 8548 B40E 2055 885C 3301 E5E8 DE60 A86A D5BB 7EC8 12E0 0041 60FF 48D7
F391 0505 2000 8108 40D2 341B 08C0 0E5F 9803 1DFE C786 2F28 A40C 6358 C3C5 6200
3088 54A0 1B10 00AD 19EE 2787 3A84 760C 6170 8300 1D22 130B 4880 051D 04D9 0D60
B00E 9739 200C 8E38 CF58 0019 9104 0082 8420 4102 305A 0114 AA64 699C C32D EED5
1C40 8632 0427 0220 2BCB 6D0A B009 4016 A82B 0EE8 05A8 CA04 8F90 4224 BB2E 8B40
1D60 D83E BA30 D72F 807D 8B03 9AE1 29F8 5E2D 0278 A00F 4430 4017 1442 0408 0120
A4CF F4CB DF98 F897 3900 A62F 0008 0C11 0F45 C81E 01B8 4411 7EE0 4600 0CE8 004A
ADCD 263B F954 120D 2600 A2C4 002C 8E5A 1B01 6440 953C 69E5 A2C4 B426 A764 30A8
446D 5C10 F681 8ABE 9AAB 9720 4996 7B21 D2AC 67FD 235A 3561 0132 8061 4C0C C442
99E2 1B89 8A9F C9B8 6896 809A 6511 4009 AEE9 6260 6873 5D15 FCA6 6201 20CE 9B95
D35E E73C 983A D909 0077 C213 9DF2 ACD8 C5D8 7CCF E012 540D AA88 6996 0200 072E
EEF3 8537 35F3 42A7 D650 903C 744D 401B 0030 BC80 09AB F2D9 CFF1 7903 393A 2A13
8542 6DC5 8E7C 344D F580 522B 8AAD 367D 86A2 2094 A0E7 1387 BA85 8470 42A0 8195
---------------------------------------------------------------------------
LABEL:          DSI_PROC
IDENTIFIER:     9D035E4D

Date/Time:       Wed Aug 12 19:12:34 CUT 2015
Sequence Number: 989
Machine Id:      00052294D700
Node Id:         ZSOFAPP
Class:           S
Type:            PERM
Resource Name:   SYSVMM         

Description
DATA STORAGE INTERRUPT, PROCESSOR

Probable Causes
SOFTWARE PROGRAM

Failure Causes
SOFTWARE PROGRAM

        Recommended Actions
        IF PROBLEM PERSISTS THEN DO THE FOLLOWING
        CONTACT APPROPRIATE SERVICE REPRESENTATIVE

Detail Data
DATA STORAGE INTERRUPT STATUS REGISTER
0000 0000 0000 0000
SEGMENT REGISTER, SEGREG
0A00 0000 0000 7FFF
DATA STORAGE INTERRUPT ADDRESS REGISTER
FFFF D000 0000 0000
EXVAL
0000 006C 0000 0000
---------------------------------------------------------------------------
LABEL:          ERRLOG_ON
IDENTIFIER:     9DBCFDEE

Date/Time:       Wed Aug 12 19:13:21 CUT 2015
Sequence Number: 988
Machine Id:      00052294D700
Node Id:         ZSOFAPP
Class:           O
Type:            TEMP
Resource Name:   errdemon        

Description
ERROR LOGGING TURNED ON

Probable Causes
ERRDEMON STARTED AUTOMATICALLY

User Causes
/USR/LIB/ERRDEMON COMMAND

        Recommended Actions
        NONE

---------------------------------------------------------------------------
参与12

8同行回答

cuizengshuncuizengshun系统运维工程师民生银行
回复 8# xuejun211314 你好,9D035E4D   0812191215 P S SYSVMM         DATA STORAGE INTERRUPT, PROCESSOR这条记录说明dump是DSI类型的(备注:DSI的代码是3xx,ISI的代码是400....)这些代码只是说明dump产生的类型,不一定通过这一条记...显示全部
回复 8# xuejun211314
你好,9D035E4D   0812191215 P S SYSVMM         DATA STORAGE INTERRUPT, PROCESSOR这条记录说明dump是DSI类型的(备注:DSI的代码是3xx,ISI的代码是400....)这些代码只是说明dump产生的类型,不一定通过这一条记录说明出宕机的原因
同时会员jiaxu2000提到了一下bug,这个bug为http://www-01.ibm.com/support/docview.wss?uid=isg1IZ06140,这个bug也是在同样版本下的操作系统产生了DSI crash,但如果不分析dump,不太好只通过简单的描述来判定是否是该bug导致的。收起
银行 · 2015-08-17
浏览5109
xuejun211314xuejun211314网络工程师太极计算机股份有限公司
回复 2# cuizengshun 9D035E4D   0812191215 P S SYSVMM         DATA STORAGE INTERRUPT, PROCESSOR,这条告警信息有影响吗?谢谢显示全部
回复 2# cuizengshun

9D035E4D   0812191215 P S SYSVMM         DATA STORAGE INTERRUPT, PROCESSOR,这条告警信息有影响吗?谢谢收起
软件开发 · 2015-08-17
浏览4968
xuejun211314xuejun211314网络工程师太极计算机股份有限公司
回复 4# jiaxu2000   谢谢显示全部
回复 4# jiaxu2000


  谢谢收起
软件开发 · 2015-08-17
浏览4810
xuejun211314xuejun211314网络工程师太极计算机股份有限公司
回复 5# cuizengshun 好的,谢谢你! 由于是第一次发表求助,不知道怎么给你积分什么的!只能先行谢谢了显示全部
回复 5# cuizengshun


好的,谢谢你! 由于是第一次发表求助,不知道怎么给你积分什么的!只能先行谢谢了收起
软件开发 · 2015-08-17
浏览5209
jiaxu2000jiaxu2000系统工程师沈阳医学院附属中心医院
http://www-01.ibm.com/support/docview.wss?uid=isg1IZ06140显示全部
事业单位 · 2015-08-17
浏览5111
xuejun211314xuejun211314网络工程师太极计算机股份有限公司
回复 2# zwz99999 你好,那个是风扇的告警我在5月份已经更换过风扇了,需要帮忙解答下8月12日的告警信息谢谢显示全部
回复 2# zwz99999

你好,那个是风扇的告警我在5月份已经更换过风扇了,需要帮忙解答下8月12日的告警信息谢谢收起
软件开发 · 2015-08-17
浏览4867
zwz99999zwz99999系统工程师dcits
errpt -aj BFE4C025  发出来看看显示全部
errpt -aj BFE4C025  发出来看看收起
系统集成 · 2015-08-17
浏览5053
cuizengshuncuizengshun系统运维工程师民生银行
从errpt来看,操作系统在8月12日有如下告警。IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTIONA6DF45AA   0812191315 I O RMCdaemon      The daemon is started.67145A39   0812191215 U S SYSDUMP&n...显示全部
从errpt来看,操作系统在8月12日有如下告警。

IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
A6DF45AA   0812191315 I O RMCdaemon      The daemon is started.
67145A39   0812191215 U S SYSDUMP        SYSTEM DUMP
F48137AC   0812191215 U O minidump       COMPRESSED MINIMAL DUMP
9D035E4D   0812191215 P S SYSVMM         DATA STORAGE INTERRUPT, PROCESSOR
9DBCFDEE   0812191315 T O errdemon       ERROR LOGGING TURNED ON

其中最核心的是67145A39   0812191215 U S SYSDUMP        SYSTEM DUMP这一条。
这一条的意思是操作系统宕机了,并产生了dump。

因此后续要分析dump数据,看看宕机的原因是什么。
一、如果你的机器有800服务,开个PMR,并把snap -ac数据上传,请他们分析宕机原因
二、如果没有800服务,那你只能自己看dump了。

1:检查dump是否成功:
#sysdumpdev -L
确认输出有:
Dump status:0
dump completed successfully

2:把dump转出来
#snap -r;snap -D
snap -D是把dump从dump设备拷贝到/tmp/ibmsupt/dump下面,因为我们直接在本地处理,
所以不用-c再压缩一遍了。

需要注意的是,因为dump默认我们都是压缩的,解开以后会非常大,如果/tmp空间不够的话,
可以在snap的时候用-d /dir 参数更改snap的工作目录为一个空间足够的文件系统里边。

dump目录下,有以下几个文件:
dump.BZ  这个是压缩的dump文件,用dmpuncompress dump.BZ解压。
unix.Z   产生dump主机的aix 核心,用uncompress unix.Z 解压。
kdb,kdb_64 产生dump主机的kdb工具,uncompress之!

因为我们分析dump的主机往往和目标主机aix版本不一致,所以收集dump的时候,会把目标主机的
kernel和kdb工具都包含进来,一点要用和dump匹配的kernel和kdb,否则无法分析dump。

3:打开dump。
解开以后,打开dump就简单了,其实就是用dump目录里边的kdb来打开。
#./kdb dump unix

cdtc[/dump/zengdb/53021.000.672/dump]#uncompress unix.Z
cdtc[/dump/zengdb/53021.000.672/dump]#./kdb dump unix
The specified kernel file is a 64-bit kernel
dump mapped from @ 700000000000000 to @ 700000298e185e5
Preserving 1412209 bytes of symbol table
First symbol __mulh
Component Names:
1)  minidump [2 entries]
2)  dmp_minimal [9 entries]
3)  proc [3327 entries]
4)  thrd [5929 entries]
5)  rasct [1 entries]
6)  ldr [2 entries]
7)  iplcb [1 entries]
8)  errlg [3 entries]
9)  mtrc [38 entries]
10)  lfs [1 entries]
11)  bos [2 entries]
12)  ipc [7 entries]
13)  vmm [14 entries]
14)  alloc_kheap [256 entries]
15)  alloc_other [690 entries]
16)  rtastrc [1 entries]
17)  sisraid [2 entries]
18)  sscsidd [4 entries]
19)  aixpcm [14 entries]
20)  efcdd [42 entries]
21)  scdisk [13 entries]
22)  lvm [2 entries]
23)  jfs2 [1 entries]
24)  tty [4 entries]
25)  netstat [10 entries]
26)  goent_dd [10 entries]
27)  vpathdd [60 entries]
28)  scsidisk [374 entries]
29)  efscsi [5 entries]
30)  dump_statistics [1 entries]
Component Dump Table has 10825 entries
           START              END
0000000000001000 0000000003DF7050 start+000FD8
F00000002FF47600 F00000002FFDC940 __ublock+000000
000000002FF22FF4 000000002FF22FF8 environ+000000
000000002FF22FF8 000000002FF22FFC errno+000000
F100070F00000000 F100070F10000000 pvproc+000000
F100070F10000000 F100070F18000000 pvthread+000000
PFT:
PVT:
id....................0002
raddr.....0000000002000000 eaddr.....F200800130000000
size..............00080000 align.............00001000
valid..1 ros....0 fixlmb.1 seg....0 wimg...2
Dump analysis on CHRP_SMP_PCI POWER_PC POWER_5 machine with 12 available CPU(s)  (64-bit registers)
Processing symbol table...
.......................done
(0)>

现在dump就正式打开,可以作进一步的分析了,
如果有想深入研究的话,建议下载AIX官方文档(inforcenter和aix文档盘上都有)里边kdb手册
和汇编手册。收起
银行 · 2015-08-17
浏览5335

提问者

xuejun211314
网络工程师太极计算机股份有限公司

相关问题

问题状态

  • 发布时间:2015-08-17
  • 关注会员:1 人
  • 问题浏览:13962
  • 最近回答:2015-08-17
  • X社区推广