互联网服务errpt查错

又是errpt查出来的错

今天又有用户跟我反映说用errpt查出来报了两个错要我处理,但我一问应用有没有受什么影响,用户又说没有。
下面是用户传过来的错误信息,我看了一下,也上网查了一下,但就是不知道是什么原因,每次碰到这种问题我就不知道如何入手了,好像也没个什么资料专门讲每个错误码是什么意思要怎么解决,难道真的是要靠经验么?


    那边的环境是oracle 10g  rac,用了hacmp,这是其中一台主机报的错,另一台没报错。

    麻烦大家帮分析下,最好告诉下分析的方法,除了上网查询和上论坛求救外有没有其它的专门讲这一类的资料呢?现在IBM服务器还在维保期内,像这种问题是不是也可以找800要他们解决啊?现在好像除了硬件问题外我还没找过800.

    每次碰到这种错误信息真的很无耐,要是数据库的问题在应用上就体现出来了,日志基本也看得懂一点,主要还是现在对系统这块还不熟,下面是错误信息。

---------------------------------------------------------------------------
LABEL:          SRC_RSTRT
IDENTIFIER:     CB4A951F

Date/Time:       Fri Feb 25 12:16:45 GMT+08:00 2011
Sequence Number: 1117
Machine Id:      00CBDEF54C00
Node Id:         afcdb02
Class:           S
Type:            INFO
WPAR:            Global
Resource Name:   SRC            

Description
SOFTWARE PROGRAM ERROR

Probable Causes
APPLICATION PROGRAM

Failure Causes
SOFTWARE PROGRAM

        Recommended Actions
        VERIFY SUBSYSTEM RESTARTED AUTOMATICALLY

Detail Data
SYMPTOM CODE
        7936
SOFTWARE ERROR CODE
       -9035
ERROR CODE
           0
DETECTING MODULE
'srchevn.c'@line:'234'
FAILING MODULE
emaixos
---------------------------------------------------------------------------
LABEL:          HA002_ER
IDENTIFIER:     12081DC6

Date/Time:       Fri Feb 25 12:16:45 GMT+08:00 2011
Sequence Number: 1116
Machine Id:      00CBDEF54C00
Node Id:         afcdb02
Class:           S
Type:            PERM
WPAR:            Global
Resource Name:   harmad         

Description
SOFTWARE PROGRAM ERROR

Probable Causes
SUBSYSTEM

Failure Causes
SUBSYSTEM

        Recommended Actions
        REPORT DETAILED DATA
        CONTACT APPROPRIATE SERVICE REPRESENTATIVE

Detail Data
DETECTING MODULE
LPP=PSSP,Fn=aixos_spmiVGLV.c,SID=1.6,L#=2085,                                   
DIAGNOSTIC EXPLANATION
aixos_get_system_VGLVs(): 2522-614 An assertion has stopped program execution: (svg_obj_cnt > 0) value1: 0 value2: 0.
参与22

21同行回答

kanter2008kanter2008系统工程师上海***
我遇到的跟你类似,有点区别。我又查了查,原因是就在topas本身。635622 这个topas 异常了。这个是不是监控取数据的脚本呢?我直接杀了 进程,topas恢复了。[tlg1a0][root][/]>ps -ef|grep 635622 root 381160 360864 0 18:28:34 pts/3 0:00 grep 635622 root 635622 1 72 Sep 1...显示全部
我遇到的跟你类似,有点区别。

我又查了查,原因是就在topas本身。

635622 这个topas 异常了。

这个是不是监控取数据的脚本呢?

我直接杀了 进程,topas恢复了。



[tlg1a0][root][/]>ps -ef|grep 635622
root 381160 360864 0 18:28:34 pts/3 0:00 grep 635622
root 635622 1 72 Sep 12 - 5348:26 topas -i5 -P
[tlg1a0][root][/]>ps -ef|grep topas
root 381172 360864 0 18:28:51 pts/3 0:00 grep topas
root 635622 1 120 Sep 12 - 5348:42 topas -i5 -P
[tlg1a0][root][/]>kill -9 635622
[tlg1a0][root][/]>ps -ef|grep topas
root 540980 360864 0 18:29:31 pts/3 0:00 grep topas

---------------------------------------------------------------------------
LABEL: HA002_ER
IDENTIFIER: 12081DC6

Date/Time: Fri Sep 12 01:21:49 BEIST 2014
Sequence Number: 1094829
Machine Id: 00C1EEDF4C00
Node Id: tlg1a0
Class: S
Type: PERM
Resource Name: harmad

Description
SOFTWARE PROGRAM ERROR

Probable Causes
SUBSYSTEM

Failure Causes
SUBSYSTEM

Recommended Actions
REPORT DETAILED DATA
CONTACT APPROPRIATE SERVICE REPRESENTATIVE

Detail Data
DETECTING MODULE
LPP=PSSP,Fn=aixos_spmiretry.c,SID=1.4,L#=321,
DIAGNOSTIC EXPLANATION
aixos_retrySpmiPathGetCx(): 2522-629 SPMI routine SpmiPathGetCx returned error 192:
Spmi: Common Memory locked by process 635622, requestor: 225860 (S                                     <-------------原因
Duplicates
Number of duplicates
1
Time of first duplicate
Fri Sep 12 01:21:28 BEIST 2014
Time of last duplicate
Fri Sep 12 01:21:49 BEIST 2014
---------------------------------------------------------------------------收起
互联网服务 · 2014-09-15
浏览2853
kanter2008kanter2008系统工程师上海***
对每个CASE都保持高度警惕。高度警惕别过度担忧就行!分析过后直接errclear 0。一觉睡到天亮才是王道。显示全部
对每个CASE都保持高度警惕。高度警惕别过度担忧就行!
分析过后直接errclear 0。一觉睡到天亮才是王道。收起
互联网服务 · 2013-02-06
浏览2599
ufidawbufidawb软件开发工程师用友软件股份有限公司海南分公司
学习了,不断进步,向专家学习显示全部
学习了,不断进步,向专家学习收起
互联网服务 · 2013-02-05
浏览2626
kidd5tykidd5ty系统工程师mtro3
我这里也是经常会报12081DC6的错误,一直不知道原因呢,对业务又没有任何影响,也不知道是否需要采取措施。显示全部
我这里也是经常会报12081DC6的错误,一直不知道原因呢,对业务又没有任何影响,也不知道是否需要采取措施。收起
互联网服务 · 2013-02-04
浏览2605
zhangguanghezhangguanghe系统工程师长城软件
只要不影响应用,应该没问题的。显示全部
只要不影响应用,应该没问题的。收起
系统集成 · 2011-08-30
浏览2604
lcq225lcq225软件开发工程师Haike Group
借鉴学习啦,我用errpt命令去试试显示全部
借鉴学习啦,我用errpt命令去试试收起
互联网服务 · 2011-08-18
浏览2612
feizi111feizi111系统工程师深圳市科维思信息技术有限公司
学习了!显示全部
学习了!收起
互联网服务 · 2011-08-15
浏览2582
cwnlinuxcwnlinux系统工程师CCSU
S类的报错,基本上不用去处理。除非系统或者应用已经不正常了。显示全部
S类的报错,基本上不用去处理。除非系统或者应用已经不正常了。收起
互联网服务 · 2011-05-16
浏览2610
sendmailsendmail联盟成员软件开发工程师广州某IT公司
S类的报错  我基本都没去管 :lol显示全部
S类的报错  我基本都没去管 :lol收起
政府机关 · 2011-05-15
浏览2686
houyanpenghouyanpeng系统工程师神州数码系统集成服务有限公司
我也看到是差不多,但看错误码不一样以为不行。另外,也想过按上面的做,但现在系统运行都正常,我也不懂hacmp,而且也不在用户现场,也怕为了解决这一个错误信息反而弄出问题来。这个错误也就出了一次,先不管了,业务运行正常就行。看了oracle的alert日志也没任何问题。...显示全部
我也看到是差不多,但看错误码不一样以为不行。另外,也想过按上面的做,但现在系统运行都正常,我也不懂hacmp,而且也不在用户现场,也怕为了解决这一个错误信息反而弄出问题来。
这个错误也就出了一次,先不管了,业务运行正常就行。看了oracle的alert日志也没任何问题。收起
系统集成 · 2011-05-13
浏览2604

提问者

风影子
数据库管理员深圳
擅长领域: 服务器LinuxUnix

问题状态

  • 发布时间:2011-02-26
  • 关注会员:1 人
  • 问题浏览:25888
  • 最近回答:2014-09-15
  • X社区推广