电信运营商数据库db2 9.7

请教一下DB2故障分析 db2diag.log:page is bad

平台环境:AIX 5.3DB2 9.1.0.6 (双机A、B,DPF 16 nodes)故障情况大概是这样的:业务厂商反映数据库无法connect,报错为:no start database manager command was issued于是立即登录数据库服务器,检查发现三个主要现象:1、A主机的db2sysc进程都不见了,而B主机的8个db2sysc进程都在2、...显示全部
平台环境:AIX 5.3
DB2 9.1.0.6 (双机A、B,DPF 16 nodes)

故障情况大概是这样的:
业务厂商反映数据库无法connect,报错为:no start database manager command was issued
于是立即登录数据库服务器,检查发现三个主要现象:
1、A主机的db2sysc进程都不见了,而B主机的8个db2sysc进程都在
2、进一步查看db2diag.log(见附件),看到有大量“ZRC=0x86020001=-2046689279=SQLB_BADP "page is bad"”的报错
3、尝试db2stop force,发现执行不成功。由于业务需要紧急恢复,于是采取执行db2_kill,这一次执行成功。随后重启数据库恢复正常。

请各位高手指教,出现这种故障的可能原因在哪里?(是存储问题?还是人为操作导致的?)
不胜感激!

db2diag.log日志片段:


补充说明:
db2diag.log日志里面 Obj: {pool:11;obj:2;type:128} Parent={11;2} ,tbspaceid=11 实际上是系统临时表空间:tbs_tem_sys
通过 select * from syscat.tables where tbspaceid=11 and tableid=2 ;  查不到记录,是为什么?

附件:

附件图标db2diag.log (144.16 KB)

收起
参与9

查看其它 7 个回答goopand的回答

goopandgoopand数据库管理员亚信联创(中国)有限公司
回复 4# stevenluffy


   你的分析思路是对的。现在确实发现硬件有报错,但还不确定是否由硬件导致的bad page,目前已经收集了信息发给IBM分析。
电信运营商 · 2014-11-21
浏览1243

回答者

goopand
数据库管理员亚信联创(中国)有限公司
擅长领域: 服务器AIXUnix

goopand 最近回答过的问题

回答状态

  • 发布时间:2014-11-21
  • 关注会员:1 人
  • 回答浏览:1243
  • X社区推广