针对WAS和MQ的例行巡检,一般有哪些检查点?每个检查点判断的标准是什么?
例如:巡检WAS,需要检查文件系统、CPU是否高、线程过载、JVM性能、JDBC等方面是否正常。一般以磁盘空间未占满60%,CPU低,未发生线程过载等判断是否存在问题。
MQ检查点和标准
qmgr错误日志和mq日志 | 是否有常见报错和FDC文件产生:AMQ9999,AMQ9526,AMQ9513,AMQ9207,AMQ9206,AMQ9208,AMQ9209 |
mq tcp相关检查点 | KeepAlive=Yes tcp_keepidle保持TCP/IP连接的时间,单位为0.5秒,缺省值为14,400,即两个小时,我们可将它设为5分钟;tcp_keepinittcp连接初始timeout值,单位为0.5秒,缺省值为150,我们可将它设为50;tcp_keepintvl连接间隔,单位为0.5秒,缺省值为150,我们可将它设为50; /usr/sbin/no -o tcp_keepidle=240 /usr/sbin/no -o tcp_keepinit=50 /usr/sbin/no -o tcp_keepintvl=50 建议修改上述tcp参数 |
AdoptNewMCA | AdoptNewMCA=ALL,建议设置该参数 |
MaxChannels和MaxActiveChannels | MaxChannels和MaxActiveChannels的缺省值是100,使用服务器通道则建议修改到1000或更大 |
Disconnect interval(DISCINT)属性 | 设为6000秒,约两个小时。亦通道连续两个小时没有消息发送后就会停止。DISCINT参数设定为0,通道永远不会停止。(注:有防火墙的不能设为0)。建议关注,根据客户实际情况调整。 |
Disconnect Interval(HBINT)属性 | 为了使HeartBeat Interval和Disconnect Interval这两个参数更有效地发挥作用,一般情况下需要让Heart Beat Interval设置值小于Disconnect Interval设置值。 |
ShortRetry和LongRetry属性 | shortrty,shorttmr,longrty,longtmr,它们的缺省值分别是:10,60,999999999,1200。建议直接把shortrty调整为999999999 |
Batchsize(BATCHSZ) | 缺省情况下,通道的Batchsz是50,建议关注该参数,通道性能不好的时候,适当调整。比如,假设我们在局域网的情况下,Batch size值越大,通道的性能越好。然而,在广域网环境下,要根据网络状况的好坏来设置该参数,若网络状况很差,Batch size值越大,可能会导致通道的性能越差。 |
1,WAS DM node server的进程状态,was自带状态命令。结合系统命令查看。
2,server的was_home/profiles/node/logs/server下:SystemOut.log SystemErr.log native_stderr.log native_stdout.log
3,was_home/profiles/node/logs/ffdc 日志
4,巡检需要查看JVM 参数设置、线程池参数设置,标准应该参照客户的规范或者以通用参数设置为标准,
5,如果有性能问题时需要查看系统运行情况:内存 、CPU,如经常发生的内存泄露问题,有可能是堆内存(heap)或本地内存(native),这经常性的是一个过程性的问题,需要具体分析。