环境:
ibm 780*2 aix+Oracle rac+was ha
去年做过was的升级,但最近没有应用程序的变更,但是最近几天几乎每天22:53出现dump,采集了Javacore和heapdump,也使用了IBM的分析工具IBM HeapAnalyzer还有IBM Thread and Monitor Dump Analyzer for Java自己看了一下,但是因为是自学,之前是硬件维护工程师,几乎是小白。老实说没怎么看懂。现在将相关heapdump和javacore附在百度盘上吧,没法上传可能过大了吧,链接:https://pan.baidu.com/s/1S2GcEd0xoST8G41rNnpikA
提取码:ab12
复制这段内容后打开百度网盘手机App,操作更方便哦想请教大神们帮我分析一下。不胜感激!
理解这个故障总是在某个特定时间点发生 ?wierd;
通常问题定位都是从最底层开始,一层一层向上排查。
1. 先排除是否是硬件故障;观察780上各项资源利用率,是否有资源不足;收集硬件告警信息,是否有告警信息,例如 CPU ,内存,磁盘,网络;
2. 排除是否是AIX操作系统层面问题,收集操作系统的日志信息,查看是否有异常。
3. 看看是否是由于WAS引起,看看升级前后WAS版本的差异,查看WAS日志信息,是否有明显的提示
4. 看看应用程序是否有类似日志信息,或者调试信息,查看是否有异常
5. 最后再来看看JavaCore这类的