MQ巡检一般情况关注三个方面。1,错误日志。A)qmgr 错误日志:默认目录 /var/mqm/qmgrs//errors/AMQERR01.log,AMQERR02.log,AMQERR03.log最新日志一般记录在AMQERR01.log中,查看该日志判断mq有什么问题。常见报错:AMQ9999通道异常终止错误,AMQ9526消息序列号不一致,AMQ9...
上面已经说的很全面了,这些指标的采集后主要采取触发机制是什么,后续的流程如何走,配合资产的自动管理会相对比较完善。
OS层面sar -d 输出中的IO响应时间DB层面,下列等待事件或者lgwr的trace文件均可\'log file parallel write\',\'db file sequential read\',\'db file scattered read\'
这个问题其实可以通过操作系统监控可以看出,如果i/o等待多,那么这个方面要尤其关注了,平时用不着过分关注
个人认为,可以监控的指标有很多,但是重要的分类会有以下几种:1. 从性能上来讲,最主要的几个指标就是存储平均IO队列长度、IOPS、读写延时。队列和延时可以辅助判断链路情况以及我们架构的深度是否合理,纵向上的节点是否有问题。IOPS直接决定着我们的配置是否足够。2. 从高可用...
1. 从性能上来讲,最主要的几个指标就是存储平均IO队列长度、IOPS、读写延时。2. 从高可用上来讲,要观察所有存储链路的状态是否正常。3. 从安全角度来讲,要观察Thin模式存储的实际使用情况,以避免制备存储超过实际存储带来的写入风险。...
可以分为基础容器监控与服务性能监控,基础包括cpu、内存、网络流量,性能是监控应用服务比如请求数、处理数对比。
基础就是内存与cpu,扩展得看你应用了,比如在加速一个hadoop端口,判断是否启动正常。
内存、cpu、网络流量,这几个重要,至于硬盘一般都是通过volume挂着,他的空间大小与io一般都可以忽略。
WAS v9可以监控系统整体运行状况,应用程序,缓存、事务、用户响应时间等。具体请参考链接https://www.ibm.com/support/knowledgecenter/zh/SSAW57_9.0.0/com.ibm.websphere.nd.multiplatform.doc/ae/welc6topmonitoring.html