互联网服务errpt查错

又是errpt查出来的错

今天又有用户跟我反映说用errpt查出来报了两个错要我处理,但我一问应用有没有受什么影响,用户又说没有。下面是用户传过来的错误信息,我看了一下,也上网查了一下,但就是不知道是什么原因,每次碰到这种问题我就不知道如何入手了,好像也没个什么资料专门讲每个错误码是什么意思要...显示全部
今天又有用户跟我反映说用errpt查出来报了两个错要我处理,但我一问应用有没有受什么影响,用户又说没有。
下面是用户传过来的错误信息,我看了一下,也上网查了一下,但就是不知道是什么原因,每次碰到这种问题我就不知道如何入手了,好像也没个什么资料专门讲每个错误码是什么意思要怎么解决,难道真的是要靠经验么?


    那边的环境是oracle 10g  rac,用了hacmp,这是其中一台主机报的错,另一台没报错。

    麻烦大家帮分析下,最好告诉下分析的方法,除了上网查询和上论坛求救外有没有其它的专门讲这一类的资料呢?现在IBM服务器还在维保期内,像这种问题是不是也可以找800要他们解决啊?现在好像除了硬件问题外我还没找过800.

    每次碰到这种错误信息真的很无耐,要是数据库的问题在应用上就体现出来了,日志基本也看得懂一点,主要还是现在对系统这块还不熟,下面是错误信息。

---------------------------------------------------------------------------
LABEL:          SRC_RSTRT
IDENTIFIER:     CB4A951F

Date/Time:       Fri Feb 25 12:16:45 GMT+08:00 2011
Sequence Number: 1117
Machine Id:      00CBDEF54C00
Node Id:         afcdb02
Class:           S
Type:            INFO
WPAR:            Global
Resource Name:   SRC            

Description
SOFTWARE PROGRAM ERROR

Probable Causes
APPLICATION PROGRAM

Failure Causes
SOFTWARE PROGRAM

        Recommended Actions
        VERIFY SUBSYSTEM RESTARTED AUTOMATICALLY

Detail Data
SYMPTOM CODE
        7936
SOFTWARE ERROR CODE
       -9035
ERROR CODE
           0
DETECTING MODULE
'srchevn.c'@line:'234'
FAILING MODULE
emaixos
---------------------------------------------------------------------------
LABEL:          HA002_ER
IDENTIFIER:     12081DC6

Date/Time:       Fri Feb 25 12:16:45 GMT+08:00 2011
Sequence Number: 1116
Machine Id:      00CBDEF54C00
Node Id:         afcdb02
Class:           S
Type:            PERM
WPAR:            Global
Resource Name:   harmad         

Description
SOFTWARE PROGRAM ERROR

Probable Causes
SUBSYSTEM

Failure Causes
SUBSYSTEM

        Recommended Actions
        REPORT DETAILED DATA
        CONTACT APPROPRIATE SERVICE REPRESENTATIVE

Detail Data
DETECTING MODULE
LPP=PSSP,Fn=aixos_spmiVGLV.c,SID=1.6,L#=2085,                                   
DIAGNOSTIC EXPLANATION
aixos_get_system_VGLVs(): 2522-614 An assertion has stopped program execution: (svg_obj_cnt > 0) value1: 0 value2: 0.收起
参与22

查看其它 20 个回答kanter2008的回答

kanter2008kanter2008系统工程师上海***
我遇到的跟你类似,有点区别。

我又查了查,原因是就在topas本身。

635622 这个topas 异常了。

这个是不是监控取数据的脚本呢?

我直接杀了 进程,topas恢复了。



[tlg1a0][root][/]>ps -ef|grep 635622
root 381160 360864 0 18:28:34 pts/3 0:00 grep 635622
root 635622 1 72 Sep 12 - 5348:26 topas -i5 -P
[tlg1a0][root][/]>ps -ef|grep topas
root 381172 360864 0 18:28:51 pts/3 0:00 grep topas
root 635622 1 120 Sep 12 - 5348:42 topas -i5 -P
[tlg1a0][root][/]>kill -9 635622
[tlg1a0][root][/]>ps -ef|grep topas
root 540980 360864 0 18:29:31 pts/3 0:00 grep topas

---------------------------------------------------------------------------
LABEL: HA002_ER
IDENTIFIER: 12081DC6

Date/Time: Fri Sep 12 01:21:49 BEIST 2014
Sequence Number: 1094829
Machine Id: 00C1EEDF4C00
Node Id: tlg1a0
Class: S
Type: PERM
Resource Name: harmad

Description
SOFTWARE PROGRAM ERROR

Probable Causes
SUBSYSTEM

Failure Causes
SUBSYSTEM

Recommended Actions
REPORT DETAILED DATA
CONTACT APPROPRIATE SERVICE REPRESENTATIVE

Detail Data
DETECTING MODULE
LPP=PSSP,Fn=aixos_spmiretry.c,SID=1.4,L#=321,
DIAGNOSTIC EXPLANATION
aixos_retrySpmiPathGetCx(): 2522-629 SPMI routine SpmiPathGetCx returned error 192:
Spmi: Common Memory locked by process 635622, requestor: 225860 (S                                     <-------------原因
Duplicates
Number of duplicates
1
Time of first duplicate
Fri Sep 12 01:21:28 BEIST 2014
Time of last duplicate
Fri Sep 12 01:21:49 BEIST 2014
---------------------------------------------------------------------------
互联网服务 · 2014-09-15
浏览2866

回答者

kanter2008
系统工程师上海***
擅长领域: 服务器AIXUnix

kanter2008 最近回答过的问题

回答状态

  • 发布时间:2014-09-15
  • 关注会员:1 人
  • 回答浏览:2866
  • X社区推广