Aix 6.1 dump 分析求教思路

WARNING: Version mismatch between unix file and command kdb
           START              END
0000000000001000 0000000004090000 start+000FD8
F00000002FF47600 F00000002FFDF948 __ublock+000000
000000002FF22FF4 000000002FF22FF8 environ+000000
000000002FF22FF8 000000002FF22FFC errno+000000
F1000F0A00000000 F1000F0A10000000 pvproc+000000
F1000F0A10000000 F1000F0A18000000 pvthread+000000
Dump analysis on CHRP_SMP_PCI POWER_PC POWER_7 machine with 16 available CPU(s)  (64-bit registers)
Processing symbol table...
.......................done
read vscsi_scsi_ptrs OK, ptr = 0xF1000000B015F378
(0)> stat
SYSTEM_CONFIGURATION:
CHRP_SMP_PCI POWER_PC POWER_7 machine with 16 available CPU(s)  (64-bit registers)

SYSTEM STATUS:
sysname... AIX
nodename.. xxxxxx
release... 1
version... 6
build date Apr 12 2012
build time 20:58:13
label..... j2012_15A9
machine... 00F85C254C00
nid....... F85C254C
time of crash: Fri Jul 17 19:23:25 2015
age of system: 41 day, 8 hr., 26 min., 36 sec.
xmalloc debug: enabled
FRRs active... 0
FRRs started.. 0

CRASH INFORMATION:
CPU -1 CSA 03C63CE8 at time of crash, error code for LEDs: 00000000
(0)> proc
              SLOT NAME     STATE      PID    PPID          ADSPACE  CL #THS

pvproc+018C00   99*sysdumps ACTIVE 063006A 0540038 000000105D705480   0 0001

NAME....... sysdumpstart
STATE...... stat  :07  .... xstat :0000
FLAGS...... flag  :00200001 LOAD EXECED
........... flag2 :00000000
........... flag3 :00000102 NOSWAP FIXPRI
........... atomic :00040000 ORPHANPGRP
........... secflag:0001 ROOT
LINKS...... child      :0000000000000000
........... siblings   :0000000000000000
........... uidinfo    :000000000243EB58
........... ganchor    :0000000000000000
THREAD..... threadlist :F1000F0A1001CB00
DISPATCH... synch      :FFFFFFFFFFFFFFFF
AACCT...... projid      :00000000  ........... sprojid     :00000000
........... subproj     :0000000000000000
........... file id     :0000000000000000 0000000000000000 00000000
........... kcid       :00000000
........... flags       :0000
WLM........ class/wlm  :00/0000
........... time of SIGTERM:00000000
........... wlm_nvpages      :0000000000000000  0
........... totalcputime     :0000000000000000
........... totalscputime    :0000000000000000
........... totaldiskio      :0000000000000000
IDENTIFIER. uid        :00000000  ........... suid       :00000000
........... pid        :0063006A  ........... ppid       :00540038
........... sid        :00520014  ........... pgrp       :00520014
MISC...... lock       @ F1000F0A00018CF0 0000000000000000
.......... lock_d     @ F1000F0A00018DA8 0000000000000000
..... parent_lock     @ F1000F0A00018DA0 0000000000000000
..... session_lock    @ F1000F0A00018D98 0000000000000000
........... pgrpl      :0000000000000000
........... pgrpb      :F1000F0A00015000
........... ttyl       :0000000000000000
........... ipc        :0000000000000000  ... sigs_queued:0
........... dblist     :0000000000000000  ... dbnext     :0000000000000000
........... eyec       :7076707250524F43  (pvprPROC)
STATISTICS. nframes    :0000000000000021  ... npsblks    :0000000000000000
........... nvpages    :0000000000000021  ... auditmask  :00000000
........... ncpages    :0000000000000000
SCHEDULER.. sched_next :0000000000000000  ... sched_back :0000000000000000
......... usched_lock @ F1000F0A00018D10 0000000000000000
........... uschedp    :0000000000000000
........... asyncio    :0000000000000000
CHECKPOINT. crid       :00000000  ........... crid_token :FFFFFFFF
........... cridnext   :0000000000000000  ... chksynch   :FFFFFFFF
........... vpid       :00000000  ........... vppid      :00000000
........... vsid       :00000000  ........... vpgrp      :00000000
PROCFS..... procfsvn   :0000000000000000
NUMA....... rset       :0000000000000000
EWLM....... ewlmproc   :0000000000000000
PROC....... procp      :F1000A0900191800  ... size       :00000328
    ....... pri        :00  ................. policy     :02
BOP........ bop_flags  :0000  .............. monitor_count :0000

FLAGS...... flag  :00000000
........... flag2 :00000000
........... int   :00000000
........... atomic:00000000
THREAD..... threadcount:00000001  ........... active     :00000001
........... suspended  :00000000  ........... terminating:00000000
........... local      :00000000  ........... wlm        :00000001
........... wlmoc      :00000000
SCHEDULE... nice       :       0  ........... sched_pri  :     255
DISPATCH... pevent     :0000000000000000
IDENTIFIER. pid        :0063006A
MISC....... adspace    :000000105D705480
........... adtable    :FFFFFFFFFFFFFFFF  ... adspace_ldr:00007FFFFFFFF080
........... eyec       :70726F6350524F43  (procPROC)
........... uprobe     :0000000000000000   ... forktime   :00573D78ACE56FCA
SIGNAL..... infoq      :0000000000000000
........... pending    :[3] 0000000000000000
........................[2] 0000000000000000
........................[1] 0000000000000000
........................[0] 0000000000000000
........... sigignore  :[3] 0000000000000000
........................[2] 0000000000000000
........................[1] 0000000000000000
........................[0] 0601000018728006
........................ INT QUIT URG TSTP TTIN TTOU
........................ IO WINCH PWR RECOVERY RECONFIG CPUFAIL
........... sigcatch   :[3] 0000000000000000
........................[2] 0000000000000000
........................[1] 0000000000000000
........................[0] 0000000000000000
........... siginfo    :[3] 0000000000000000
........................[2] 0000000000000000
........................[1] 0000000000000000
........................[0] 0000000000000000
STATISTICS. page size  :0000000000000015  ... minflt     :0000000000000068
........... majflt     :0000000000000004  ... pctcpu     :00000000
....... inputdiskio    :0000000000005000
....... inputio ops    :0000000000000004
....... outputdiskio   :0000000000000000
....... outputio ops   :0000000000000000
....... logdiskio      :0000000000000000
....... logio ops      :0000000000000000
SCHEDULER.. repage     :0000000000000000  ... sched_count:00000000
........... cpticks    :0000....  ........... msgcnt     :0000
........... majfltsec  :00000000
........... rs_attinfo :0000000000000000  ........... sradassign :0000
........... rs_rss     :000000000000001A  ........... boundcount :0000
. no. of threads w/rset:               0  ...........     w/srad :   0
CHECKPOINT. chkblock   :00000000  ........... chkfile    :0000000000000000
POSIX RT TIMERS        :Data not present in dump.

CPU-time... clock ticks:0000000A
........... active     :0000000000000000
PROCFS..... prtrcset   :0000000000000000
PVPROC..... pvprocp    :F1000F0A00018C00  ... size       :00000400

(0)> errpt                     
There are no unprocessed error log entries
(0)> vmlog
Most recent VMM errorlog entry
Error id               =         
Exception DSISR/ISISR  =  0000000000000000
Exception srval        =  0000000000000000
Exception virt addr    =  0000000000000000
Exception value        =  00000000


(0)> symptom
Can't generate symptom data from this dump
(0)> dr iar
iar   : 0000000000310FC0
.longjmpx+000000       mflr    r0                  <.vm_lookupx_dr+000028>
(0)> f -v
pvthread+01CB00 STACK:

=======================================================================
F1000A00102D5A20: F100 0A00  102D 5AA0  0000 0000  0000 0000   .....-Z.........
F1000A00102D5A30: F100 0A00  102D 5AA0  0000 0000  0000 0000   .....-Z.........
F1000A00102D5A40: 0000 0000  0000 0000  0000 0000  0000 0000   ................
F1000A00102D5A50: 0000 0000  0000 0000  0000 0000  0000 0000   ................
F1000A00102D5A60: 0000 0000  0000 0000  0000 0000  0000 0000   ................
F1000A00102D5A70: 0000 0000  0000 0000  0000 0000  0000 0000   ................
F1000A00102D5A80: F100 0A00  0016 61A8  0000 0000  FFFF FFFC   ......a.........
F1000A00102D5A90: 0000 0000  0000 0001  0000 0000  0000 0000   ................
- - - - -
Prev Frame: F1000A00102D5AA0  LR        : F1000A00102D5AA0
TOC       : 0000000000000000  CR        : 00000000
P1        : 0000000000000000  P2        : 0000000000000000
P3        : 0000000000000000  P4        : 0000000000000000
P5        : 0000000000000000  P6        : 0000000000000000
P7        : F1000A00001661A8  P8        : 00000000FFFFFFFC
=======================================================================
[00310FC0]longjmpx+000000 (000000000000000E [??])

=======================================================================
F1000A00102D5A20: F100 0A00  102D 5AA0  0000 0000  0000 0000   .....-Z.........
F1000A00102D5A30: F100 0A00  102D 5AA0  0000 0000  0000 0000   .....-Z.........
F1000A00102D5A40: 0000 0000  0000 0000  0000 0000  0000 0000   ................
F1000A00102D5A50: 0000 0000  0000 0000  0000 0000  0000 0000   ................
F1000A00102D5A60: 0000 0000  0000 0000  0000 0000  0000 0000   ................
F1000A00102D5A70: 0000 0000  0000 0000  0000 0000  0000 0000   ................
F1000A00102D5A80: F100 0A00  0016 61A8  0000 0000  FFFF FFFC   ......a.........
F1000A00102D5A90: 0000 0000  0000 0001  0000 0000  0000 0000   ................
- - - - -
Prev Frame: F1000A00102D5AA0  LR        : F1000A00102D5AA0
TOC       : 0000000000000000  CR        : 00000000
P1        : 0000000000000000  P2        : 0000000000000000
P3        : 0000000000000000  P4        : 0000000000000000
P5        : 0000000000000000  P6        : 0000000000000000
P7        : F1000A00001661A8  P8        : 00000000FFFFFFFC
=======================================================================
[0012C144]vm_lookupx_dr+000024 (??, ??, ??, ??, ??)

=======================================================================
F1000A00102D5AA0: 0000 0000  0000 0000  0000 0000  FFFF FFFF   ................
F1000A00102D5AB0: 0000 0000  0000 2A00  0000 0000  1000 003C   ......*........<
F1000A00102D5AC0: 0000 0000  FFFF FFFF  F100 0A05  800D 0280   ................
F1000A00102D5AD0: 0000 0000  0000 0001  0000 1032  0016 7578   ...........2..ux
- - - - -
Prev Frame: 0000000000000000  LR        : 0000000000002A00
TOC       : F1000A05800D0280  CR        : FFFFFFFF
P1        : 0000000000000001  P2        : 0000103200167578
P3        : F1000A00102D5C40  P4        : 0000000000000000
P5        : 0000000000000000  P6        : 0000000000000000
P7        : 0000000000000000  P8        : 0000000004150AF0
=======================================================================
[000029FC]start+0029D4 ()
[kdb_read_mem] no real storage @ FFFFFFFFFFF9870


(0)> errlg
Displaying error logging  area at: F1000A0000164000
ei_start............ F1000A00102D8000  ei_end.............. F1000A00102E0000
ei_inptr............ F1000A00102D8000  ei_outptr........... F1000A00102D8000
ei_stale_data_ptr... F1000A00102D8000  ei_over_write_count. 0x00000000
ei_err_count........ 0x00000000        ei_discard_count.... 0x00000000
ei_errid_1st_discard 0x00000000        ei_errid_last_discrd 0x00000000
e_state............. 0x13: RDOPEN SLEEP DUPCHECK
e_size.............. 0x00008000        e_sleepword_dd...... 0x00890073
e_dupmax............ 0x000003E8        e_prevdupcount...... 0x00000000
e_currdupcount...... 0x00000000        e_duptimeint........ 0x00002710
e_firstduptime...... 0x55A74F3C
evec.error_id....... 0xA924A5FC        evec.nel............ 0x00000001
evec.v[0].pd........ F1000A0000164088  evec.v[0].len....... 0x0000020E
e_duperec.erec_magic 0x45523032
e_duperec.erec_len.f 0x00000001        e_duperec.erec_len.l 0x0000020E
e_duperec.erec_time. 0x00000000        e_duperec.erec_r_len 0x000001A9
e_duperec.erec_s_len 0x00000041        e_duperec.erec_cid.. 0x00000000
e_duperec.erec_dupct 0x00000000
e_duperec.erec_time1 0x00000000        e_duperec.erec_time2 0x00000000
errdd_lock.......... 0x00000000        errpag_buf_lock..... 0x00000000
no_more_logging..... 0x00000000:
errlast_errorid..... 0x00000000        errduptrb........... @F1000A0000165208


从kdb 上看不出是哪个CPU crash 了,也没看到 error code ,想请教大家该如何分析这个dump 文件

系统版本是:6.1TL4
主机是:P7 750
参与5

4同行回答

clvlbllclvlbll系统工程师IBM
测试机的环境和故障机好像需要一致显示全部
测试机的环境和故障机好像需要一致收起
互联网服务 · 2015-09-06
浏览2416
ktcloudktcloud系统工程师SYSTEX Rainbow Tech inc.
回复 2# ying 你好    mismatch ,我是使用snap -D 从故障机器上收dump 整个目录下来,然后放到我的测试机去分析的,我用的unix.Z和unix.BZ也是从那个目录下的解压再执行 ./kdb dump unix 这样 这个有关系吗    我打算明天回去公司在该系统上尝试一下...显示全部
回复 2# ying

你好
    mismatch ,我是使用snap -D 从故障机器上收dump 整个目录下来,然后放到我的测试机去分析的,我用的unix.Z和unix.BZ也是从那个目录下的解压再执行 ./kdb dump unix 这样 这个有关系吗
    我打算明天回去公司在该系统上尝试一下收起
互联网服务 · 2015-09-02
浏览2453
clvlbllclvlbll系统工程师IBM
求分享dump分析方法显示全部
求分享dump分析方法收起
互联网服务 · 2015-09-01
浏览2423
yingying系统工程师龙江银行
第一行就告诉你了,版本mismatch.所以除了第一行以外,其他信息可以忽略了.所以,找到对应版本之后再重新分析吧.我可以考虑帮你一次,站内吧.显示全部
第一行就告诉你了,版本mismatch.
所以除了第一行以外,其他信息可以忽略了.
所以,找到对应版本之后再重新分析吧.
我可以考虑帮你一次,站内吧.收起
银行 · 2015-09-01
浏览2419

提问者

ktcloud
系统工程师SYSTEX Rainbow Tech inc.
擅长领域: 存储服务器存储虚拟化

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-08-27
  • 关注会员:1 人
  • 问题浏览:5735
  • 最近回答:2015-09-06
  • X社区推广