db2挂了,求大神指点

各位大神,DB2突然挂了,,具体日志如下,能帮忙看下么?谢谢!

2015-03-03-19.05.48.736202+480 I53267019E437         LEVEL: Warning
PID     : 62182                TID : 140483132081920 PROC : db2fmp (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, trace services, sqlt_logerr_data (secondary logging function), probe:50
MESSAGE : Thread of db2fmp terminated with nonzero rc
DATA #1 : Hexdump, 4 bytes
0x00007FC4C72F3E74 : 95FB FFFF                                  ....

2015-03-03-19.05.48.517583+480 I53267457E343         LEVEL: Error
PID     : 62182                TID : 140483353163552 PROC : db2fmp (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, common communication, sqlccipcdarihandshake, probe:4
RETCODE : ZRC=0x800F00FC=-2146500356=SQLO_INV_PARM "Invalid input parameter"

2015-03-03-19.05.48.517644+480 I53267801E343         LEVEL: Error
PID     : 62182                TID : 140483157907200 PROC : db2fmp (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, common communication, sqlccipcdarihandshake, probe:4
RETCODE : ZRC=0x800F00FC=-2146500356=SQLO_INV_PARM "Invalid input parameter"

2015-03-03-19.05.48.737196+480 I53268145E418         LEVEL: Error
PID     : 62182                TID : 140483157907200 PROC : db2fmp (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, routine_infrastructure, sqlerFmpListener, probe:999
MESSAGE : FMP exiting with error. Last agent registered:
DATA #1 : Hexdump, 4 bytes
0x00007FC4C8B94BD4 : 0000 0000                                  ....

2015-03-03-19.05.48.737287+480 I53268564E437         LEVEL: Warning
PID     : 62182                TID : 140483157907200 PROC : db2fmp (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, trace services, sqlt_logerr_data (secondary logging function), probe:50
MESSAGE : Thread of db2fmp terminated with nonzero rc
DATA #1 : Hexdump, 4 bytes
0x00007FC4C8B94E74 : 95FB FFFF                                  ....

2015-03-03-19.05.48.517488+480 I53269002E343         LEVEL: Error
PID     : 56357                TID : 139707602036512 PROC : db2fmp (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, common communication, sqlccipcdarihandshake, probe:4
RETCODE : ZRC=0x800F00FC=-2146500356=SQLO_INV_PARM "Invalid input parameter"

2015-03-03-19.05.48.822550+480 I53269346E418         LEVEL: Error
PID     : 56357                TID : 139707602036512 PROC : db2fmp (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, routine_infrastructure, sqlerFmpListener, probe:999
MESSAGE : FMP exiting with error. Last agent registered:
DATA #1 : Hexdump, 4 bytes
0x00007FFF5DBCDEF4 : 0000 0000                                  ....

2015-03-03-19.05.48.574629+480 I53269765E404         LEVEL: Event
PID     : 59830                TID : 140125245794048 PROC : db2wdog 0 [db2ibcrm]
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
EDUID   : 2                    EDUNAME: db2wdog 0 [db2ibcrm]
FUNCTION: DB2 UDB, oper system services, sqloCleanUpPosixIPCResources, probe:100
MESSAGE : Clean up POSIX resources attempt from engine.

2015-03-03-19.05.48.875149+480 I53270170E405         LEVEL: Event
PID     : 59830                TID : 140125245794048 PROC : db2wdog 0 [db2ibcrm]
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
EDUID   : 2                    EDUNAME: db2wdog 0 [db2ibcrm]
FUNCTION: DB2 UDB, oper system services, sqloCleanUpSystemVIPCResources, probe:1557
DATA #1 :
Remove trace memory segments

2015-03-03-19.05.48.232310+480 I53270576E502         LEVEL: Error
PID     : 59848                TID : 139771261880096 PROC : db2vend (PD Vendor Process - 1)
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, oper system services, DB2VEND_main, probe:1040
MESSAGE : ZRC=0x870F0009=-2029060087=SQLO_EOF "the data does not exist"
          DIA8506C Unexpected end of file was reached.
DATA #1 : String, 63 bytes
Fenced vendor process pipe failure, terminating vendor process.

2015-03-03-19.05.48.953377+480 I53271079G343        LEVEL: Error
PID     : 56359                TID : 4099106512     PROC : db2fmp32 (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, common communication, sqlccipcdarihandshake, probe:4
RETCODE : ZRC=0x800F00FC=-2146500356=SQLO_INV_PARM "Invalid input parameter"

2015-03-03-19.05.49.147009+480 I53271423G410        LEVEL: Error
PID     : 56359                TID : 4099106512     PROC : db2fmp32 (
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, routine_infrastructure, sqlerFmpListener, probe:999
MESSAGE : FMP exiting with error. Last agent registered:DATA #1 : Hexdump, 4 bytes
0xFFC3F904 : A312 0000                                  ....
------------------------------------------------------------------------------------------------------这个地方数据库没日志,挂了
2015-03-04-08.13.51.165371+480 I53271834E384         LEVEL: Event
PID     : 38537                TID : 139711767717664 PROC : db2start
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, base sys utilities, sqleGetStStLockFile, probe:12825
MESSAGE : Obtained exclusive mode lock on the file:
DATA #1 : String, 38 bytes
/app/db2ibcrm/sqllib/ctrl/db2strst.lck

2015-03-04-08.13.51.167489+480 I53272219E1655        LEVEL: Event
PID     : 38537                TID : 139711767717664 PROC : db2start
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, base sys utilities, sqleStartStopSingleNode, probe:1130
DATA #1 : String, 33 bytes
/app/db2ibcrm/sqllib/adm/db2star2
DATA #2 : Hexdump, 256 bytes
0x00007FFFEE1306F0 : 2F61 7070 2F64 6232 6962 6372 6D2F 7371    /app/db2ibcrm/sq
0x00007FFFEE130700 : 6C6C 6962 2F61 646D 2F64 6232 7374 6172    llib/adm/db2star
0x00007FFFEE130710 : 3200 4E4F 4D53 4700 0000 0000 0000 0000    2.NOMSG.........
0x00007FFFEE130720 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE130730 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE130740 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE130750 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE130760 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE130770 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE130780 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE130790 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE1307A0 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE1307B0 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE1307C0 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE1307D0 : 0000 0000 0000 0000 0000 0000 0000 0000    ................
0x00007FFFEE1307E0 : 0000 0000 0000 0000 0000 0000 0000 0000    ................

2015-03-04-08.13.51.287360+480 I53273875E384         LEVEL: Event
PID     : 38539                TID : 140328327415584 PROC : db2star2
INSTANCE: db2ibcrm             NODE : 000
HOSTNAME: DW2APP
FUNCTION: DB2 UDB, base sys utilities, sqleGetStStLockFile, probe:12825
MESSAGE : Obtained exclusive mode lock on the file:
DATA #1 : String, 38 bytes
/app/db2ibcrm/sqllib/ctrl/db2stst.0000


文件信息

附件:

附件图标db2diag.zip (5.63 MB)

附件图标db2diag.zip (5.63 MB)

附件图标messages20150304.zip (689.75 KB)

参与26

25同行回答

drdb2drdb2系统工程师se
"/var/log/messages" showed your database were terminated due to "out of memory" which caused the corruption of your database.This is very dangerous, since it could happen again and again in the future if not being taken care properly.If your system i...显示全部
"/var/log/messages" showed your database were terminated due to "out of memory" which caused the corruption of your database.
This is very dangerous, since it could happen again and again in the future if not being taken care properly.
If your system is mission-critical, you need seriously review the memory settings and usages regarding your db and server.收起
互联网服务 · 2015-03-10
浏览2659
新数科技新数科技IT顾问北京新数科技有限公司
另外系统日志没有看出太多异常,谨慎估计数据库本身故障可能性大。显示全部
另外系统日志没有看出太多异常,谨慎估计数据库本身故障可能性大。收起
IT咨询服务 · 2015-03-06
浏览2567
新数科技新数科技IT顾问北京新数科技有限公司
回复 22# maomao123 现在状况如何了?大概看了下日志,不清楚前后发生的事情,所以不容易判断原因,但现在的状况是crash recovery失败,某些active log可能是障碍(也许是log文件本身,也许跟OS相关),有几种可能的建议,仅供参考:1. 如有备份文件,做恢复前滚将系统救回;2. 如果没有备份,开pmr...显示全部
回复 22# maomao123
现在状况如何了?大概看了下日志,不清楚前后发生的事情,所以不容易判断原因,但现在的状况是crash recovery失败,某些active log可能是障碍(也许是log文件本身,也许跟OS相关),有几种可能的建议,仅供参考:1. 如有备份文件,做恢复前滚将系统救回;
2. 如果没有备份,开pmr让ibm support试图绕过日志,这样会有部分数据不一致情况(尤其对当时正在执行的业务);
3. 如果上面两种都不行,数据又得就会,db2dart将数据导出,耗时耗力。
注:上面任何方法,如果有条件的话,先做好相关文件备份工作再操作,以有回退空间。


另外碰到这种数据库crash,在找办法解决的同时,通常建议尽快开高级别pmr,将ibm support involve进来,查看相关日志之后给出一些建议。收起
IT咨询服务 · 2015-03-06
浏览2673
张东焕张东焕技术总监IBM官方授权讲师
没看出来,也请其他人看看。显示全部
没看出来,也请其他人看看。收起
IT咨询服务 · 2015-03-05
浏览2632
maomao123maomao123数据仓库工程师GBICC
回复 20# 张东焕    老师,发给你了,message日志信息显示全部
回复 20# 张东焕


   老师,发给你了,message日志信息收起
银行 · 2015-03-05
浏览2589
maomao123maomao123数据仓库工程师GBICC
回复 17# 张东焕 显示全部
回复 17# 张东焕 收起
银行 · 2015-03-05
浏览2568
张东焕张东焕技术总监IBM官方授权讲师
最后的办法是db2dart,但是坏页所在的表也没有办法。显示全部
最后的办法是db2dart,但是坏页所在的表也没有办法。收起
IT咨询服务 · 2015-03-05
浏览2579
张东焕张东焕技术总监IBM官方授权讲师
可以恢复,但要有备份。显示全部
可以恢复,但要有备份。收起
IT咨询服务 · 2015-03-05
浏览2627
maomao123maomao123数据仓库工程师GBICC
回复 16# 张东焕    这种问题,该怎么处理呢?有没有恢复的可能啊?显示全部
回复 16# 张东焕


   这种问题,该怎么处理呢?有没有恢复的可能啊?收起
银行 · 2015-03-05
浏览2572
张东焕张东焕技术总监IBM官方授权讲师
将这个文件附上来 /var/log/messages显示全部
将这个文件附上来 /var/log/messages收起
IT咨询服务 · 2015-03-05
浏览2645

提问者

maomao123
数据仓库工程师GBICC

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-03-04
  • 关注会员:1 人
  • 问题浏览:18191
  • 最近回答:2015-03-10
  • X社区推广