db2 10.1.3版本
备机重放日志动作,忽然停止,导致standby 备机活动日志目录文件系统满。使用db2pd -hadr 查看各项指标正常。
在没有办法的情况下,进行了备机实例和数据库重启,备机就可以继续重放日志。
问题是如何进行此类问题的有效监控,达到提前预警。
第二出现此类问题的合理有效处理方法,以及是否需要后续升级等措施
您好,您先简单讲一下您的 HADR 环境配置(HADR_SYNCMODE等等)和业务负载情况,方便我们更加清晰地了解下问题,具体问题具体分析。
我先问几个问题啊:
首先,“ hadr standby 的 log replaying 突然停止” 问题,您是如何发现的?
当时的 diag日志,有什么线索吗?
此类问题发生前后,primary 是否存在大量并发 DML,DDL等需要记录日志操作?
此类问题是否经常发生,并伴随些规律性特征?
根据您最新的问题描述:“现象类似于standby库hang” ,我认为您应该在下次问题发生时,抓一下DB2 latch、log replay相关EDU 的堆栈信息,还有 trace信息,看看什么问题。可以写个触发脚本,当 active log 目录文件系统使用急速激增时,触发脚本收集这些信息。然后,根据这些信息判断 hang的原因,或发给 IBM 解决。
收起