电信运营商数据库db2 9.7

请教一下DB2故障分析 db2diag.log:page is bad

平台环境:AIX 5.3
DB2 9.1.0.6 (双机A、B,DPF 16 nodes)

故障情况大概是这样的:
业务厂商反映数据库无法connect,报错为:no start database manager command was issued
于是立即登录数据库服务器,检查发现三个主要现象:
1、A主机的db2sysc进程都不见了,而B主机的8个db2sysc进程都在
2、进一步查看db2diag.log(见附件),看到有大量“ZRC=0x86020001=-2046689279=SQLB_BADP "page is bad"”的报错
3、尝试db2stop force,发现执行不成功。由于业务需要紧急恢复,于是采取执行db2_kill,这一次执行成功。随后重启数据库恢复正常。

请各位高手指教,出现这种故障的可能原因在哪里?(是存储问题?还是人为操作导致的?)
不胜感激!

db2diag.log日志片段:


补充说明:
db2diag.log日志里面 Obj: {pool:11;obj:2;type:128} Parent={11;2} ,tbspaceid=11 实际上是系统临时表空间:tbs_tem_sys
通过 select * from syscat.tables where tbspaceid=11 and tableid=2 ;  查不到记录,是为什么?

附件:

附件图标db2diag.log (144.16 KB)

参与9

8同行回答

回复 8# goopand    如果方便的话,最后处理好了能否把过程和诊断结果发一下,我学习一下显示全部
回复 8# goopand


   如果方便的话,最后处理好了能否把过程和诊断结果发一下,我学习一下收起
证券 · 2014-11-21
浏览1211
goopandgoopand数据库管理员亚信联创(中国)有限公司
回复 4# stevenluffy    你的分析思路是对的。现在确实发现硬件有报错,但还不确定是否由硬件导致的bad page,目前已经收集了信息发给IBM分析。显示全部
回复 4# stevenluffy


   你的分析思路是对的。现在确实发现硬件有报错,但还不确定是否由硬件导致的bad page,目前已经收集了信息发给IBM分析。收起
电信运营商 · 2014-11-21
浏览1246
weiruan85weiruan85数据库管理员ibm
回复 6# stevenluffy     好吧,生活就是这样 :)显示全部
回复 6# stevenluffy


    好吧,生活就是这样 :)收起
政府机关 · 2014-11-20
浏览1256
回复 5# weiruan85    我没有看到default啊:)显示全部
回复 5# weiruan85


   我没有看到default啊:)收起
证券 · 2014-11-20
浏览1190
weiruan85weiruan85数据库管理员ibm
回复 4# stevenluffy     default 就是最终要找到问题发生的原因   :)显示全部
回复 4# stevenluffy


    default 就是最终要找到问题发生的原因   :)收起
政府机关 · 2014-11-19
浏览1193
回复 3# weiruan85    关键在于,bad page是否是操作系统硬件报错引起,最紧要的是排除此类错误,在确认错误之前最好要保留环境。如果只是逻辑坏块,删除确实就没问题了。显示全部
回复 3# weiruan85


   关键在于,bad page是否是操作系统硬件报错引起,最紧要的是排除此类错误,在确认错误之前最好要保留环境。如果只是逻辑坏块,删除确实就没问题了。收起
证券 · 2014-11-19
浏览1192
weiruan85weiruan85数据库管理员ibm
回复 2# stevenluffy     如果是系统临时表空间,那就把他删除掉,重建一个新的。显示全部
回复 2# stevenluffy


    如果是系统临时表空间,那就把他删除掉,重建一个新的。收起
政府机关 · 2014-11-19
浏览1228
对相关对象( Obj: {pool:11;obj:2;type:128} )inspect 或者db2dart检查是否有坏块,同时检查操作系统是否有磁盘等硬件设备报错,然后根据情况进行处理。出现坏块对数据库来说是一个严重错误,越早处理越好。...显示全部
对相关对象( Obj: {pool:11;obj:2;type:128} )inspect 或者db2dart检查是否有坏块,同时检查操作系统是否有磁盘等硬件设备报错,然后根据情况进行处理。出现坏块对数据库来说是一个严重错误,越早处理越好。收起
证券 · 2014-11-18
浏览1266

提问者

goopand
数据库管理员亚信联创(中国)有限公司
擅长领域: 服务器AIXUnix

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2014-11-18
  • 关注会员:1 人
  • 问题浏览:12390
  • 最近回答:2014-11-21
  • X社区推广