目前我们的生产数据库服务器上会部署统一的runstats脚本、删归档日志脚本、monitor脚本、还有一些数据归档脚本。 由于现在生产环境数据库达到几百台。没办法也没实现通过统一的开源工具监控所有数据库服务器上相关脚本运行情况。
os:linux aix
db: DB2
level:9.7
请问各位高人
1:针对我上面提供的情况是否有好的办法做到可以监控所有服务器上相关脚本运行情况。
2:有没有相关的开源软件可以实现我上面提到的需求。
3:银行或者相关使用DB2的公司针对上述情况都是怎么做的,难道都是一台一台上去看?
几种思路供你参考,
1 用集中化的cron job管理工具(忘记工具名字了),同一部署和管理所有服务器上的所有cron jobs
2 分别在每台服务器上设定相应的job, 然后用类似splunk之类的工具集中读取相应脚本的日志,然后分析job是否跑成功了,如果没有发告警邮件。
收起银行的监控软件,要么是商业的,要么是自己开发的,例如SHELL或者其他。一般就监控 CUP 磁盘 内存的使用情况
交易的处理是否超时,一段时间内交易的成功和失败比。交易的平均处理时长。各个系统之间的联通性
日志等 是不会轻易删除的,很多都是备份到其他的存储空间上。
使用SHELL的一般都是交易量不大的系统中才可以使用,否则频繁的进行查询很耗费资源,影响生产
收起比较简单的做法,在所有服务器上挂载同一NFS,脚本执行的时候用IP+脚本名称区别去写日志,然后写解析日志的脚本就行。