生产环境,经常出现大面积锁表,请问有什么好的解决方法?

生产环境,经常出现大面积锁表,业务收到严重影响
数据库db2, -911,有什么好的解决方法?

参与23

5同行回答

atpeace331atpeace331  数据库管理员 , 银行
你们那边 DB2 是哪个版本的? DB2 v9.7以后,Currently Commited功能是默认开启的,可以避免大量的读写事务并发导致的锁等问题。你这个问题,建议从两方面入手:1、查看生产数据库监控,看看锁资源是否充足,锁的相关数据库配置是否合理(LOCKLIST、MAXLOCKS、LOCKTIMEOUT等)看看db2...显示全部

你们那边 DB2 是哪个版本的? DB2 v9.7以后,Currently Commited功能是默认开启的,可以避免大量的读写事务并发导致的锁等问题。

你这个问题,建议从两方面入手:
1、查看生产数据库监控,看看锁资源是否充足,锁的相关数据库配置是否合理(LOCKLIST、MAXLOCKS、LOCKTIMEOUT等)看看db2diag.log 是否经常出现锁升级现象。

2、排查锁等事件中参与的并发应用,看看是否存在下面问题:
并发应用之间的执行顺序是否合理?
并发应用的隔离级别是否设置合理(注意,大多数应用中间件的隔离级别默认是 RS)?
持有锁事务是否业务逻辑过于复杂、执行时间过长,占用大量的锁资源太长时间?
并发应用中,涉及的游标应该尽快关闭,不要使用模糊游标!
并发应用的 SQL是否可以优化,避免访问不必要的数据?
并发应用的 SQL 是否有效地使用了索引?

我想到的,目前就这么多,其他思路,社区其他高手多多补充吧

收起
银行 · 2019-11-27
浏览3469
liuyh 邀答
  • 非常感谢了,并发应用的隔离级别是否设置合理这一条,将设置了was的隔离机制,问题得到了有效的解决。
    2020-01-02
kong_fanqingkong_fanqing  数据库运维工程师 , 国产数据库公司
修改配置是解决眼前当下的短期问题。修改应用程序中的SQL语句,和流程处理顺序,是解决锁类问题的根本方法。显示全部

修改配置是解决眼前当下的短期问题。修改应用程序中的SQL语句,和流程处理顺序,是解决锁类问题的根本方法。

收起
IT咨询服务 · 2019-11-27
浏览3491
  • 的确,根本问题还是应用流程处理顺序 或 SQL语句。
    2019-11-28
  • 因为解决锁问题,往往DBA解决问题时不仅要去说服一方的应用开发人员,还要向上级说明不是数据库的问题,所以最好从根本上解决锁的发生,而不是去“容纳”它的发生。
    2019-11-28
tongshuaitongshuai  数据库工程师 , 北京新数科技有限公司
从报错信息来看,是产生了锁超时,这里就需要找到持有锁的连接和等待锁的连接信息。1、首先查询目前数据库存在的锁等待db2pd -d DBNAME  -wlocks有三列信息需要关注的agent_id :应用程序 idlockname:锁名字,重点关注锁名一样的信息sts :锁状态,如果是‘G’说明应用持有这...显示全部

从报错信息来看,是产生了锁超时,这里就需要找到持有锁的连接和等待锁的连接信息。
1、首先查询目前数据库存在的锁等待
db2pd -d DBNAME  -wlocks
有三列信息需要关注的
agent_id :应用程序 id
lockname:锁名字,重点关注锁名一样的信息
sts :锁状态,如果是‘G’说明应用持有这个锁,‘W’说明应用等待这个锁。

2、根据前面查到的 agentid来查application新
db2pd -d DBNAME -app app=agentid
或者
db2pd -d DBNAME -apinfo app=agentid
这样可以查到锁和被锁的连接情况。

还有一种就是直接查系统表 SYSIBMADM.MON_LOCKWAITS。
select LOCK_NAME,REQ_APPLICATION_HANDLE,REQ_STMT_TEXT,HLD_APPLICATION_NAME,HLD_CURRENT_STMT_TEXT from SYSIBMADM.MON_LOCKWAITS with ur

用这条语句可以查出正在锁和锁等待的应用信息,更多信息可以选择更多列。

记住,上面的查锁等待信息的操作需要在锁等待时操作,如果出现了这个报错说明已经超时回滚了,也就差不到信息了。

收起
互联网服务 · 2019-11-27
浏览3550
liuyh 邀答
  • @tongshuai :兄弟,锁事件监视器一般是默认开启的,可以用它查看锁监控历史信息。
    2019-11-28
y5_sety5_set  其它 , 不告诉你
主要还是从SQL方面入手,定位到慢SQL,看一下执行计划,优化SQL才能彻底解决问题显示全部

主要还是从SQL方面入手,定位到慢SQL,看一下执行计划,优化SQL才能彻底解决问题

收起
互联网服务 · 2020-04-20
浏览2367
liuyhliuyh  系统运维工程师 , 中软国际
1、所有的业务表都已重组。2、DB2_EVALUNCOMMITTED=ON,DB2_SKIPINSERTED=ON都已设置。显示全部

1、所有的业务表都已重组。
2、DB2_EVALUNCOMMITTED=ONDB2_SKIPINSERTED=ON都已设置。

收起
IT咨询服务 · 2019-11-27
浏览3319
  • 你们的 DB2 版本号? DB2_SKIPDELETED、DB2_SKIPINSERTED、DB2_EVALUNCOMMITTED 都开启的话,是可以起到一部分 CC(currently committed)的效果。
    2019-11-28

提问者

liuyh
系统运维工程师中软国际
擅长领域: 云计算容器容器云

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2019-11-27
  • 关注会员:5 人
  • 问题浏览:6893
  • 最近回答:2020-04-20
  • X社区推广