IBM was 频繁宕机问题?

环境:
ibm 780*2  aix+Oracle rac+was ha  
     去年做过was的升级,但最近没有应用程序的变更,但是最近几天几乎每天22:53出现dump,采集了Javacore和heapdump,也使用了IBM的分析工具IBM HeapAnalyzer还有IBM Thread and Monitor Dump Analyzer for Java自己看了一下,但是因为是自学,之前是硬件维护工程师,几乎是小白。老实说没怎么看懂。现在将相关heapdump和javacore附在百度盘上吧,没法上传可能过大了吧,链接:https://pan.baidu.com/s/1S2GcEd0xoST8G41rNnpikA
提取码:ab12
复制这段内容后打开百度网盘手机App,操作更方便哦想请教大神们帮我分析一下。不胜感激!

  • 的确比较奇怪,就是在11-09,,11-11,,11-12,11-16,,11-17晚上的22:32都有报错和dump,但是到这两天又没有了,而且硬件也进行了排查。ibm aix 和neapp存储几乎每天都会进行检查。而且在javacore和heapdump也看到是内存溢出呢具体可以看我上传的日志
    2020-11-21

1回答

理解这个故障总是在某个特定时间点发生 ?wierd;通常问题定位都是从最底层开始,一层一层向上排查。1. 先排除是否是硬件故障;观察780上各项资源利用率,是否有资源不足;收集硬件告警信息,是否有告警信息,例如 CPU ,内存,磁盘,网络;2. 排除是否是AIX操作系统层面问题,收集操作系统...显示全部

理解这个故障总是在某个特定时间点发生 ?wierd;
通常问题定位都是从最底层开始,一层一层向上排查。
1. 先排除是否是硬件故障;观察780上各项资源利用率,是否有资源不足;收集硬件告警信息,是否有告警信息,例如 CPU ,内存,磁盘,网络;
2. 排除是否是AIX操作系统层面问题,收集操作系统的日志信息,查看是否有异常。
3. 看看是否是由于WAS引起,看看升级前后WAS版本的差异,查看WAS日志信息,是否有明显的提示
4. 看看应用程序是否有类似日志信息,或者调试信息,查看是否有异常
5. 最后再来看看JavaCore这类的

收起
 2020-11-20

提问者

水深火热的仲夏工程师, 某科技公司

核心数据库服务器选型优先顺序调查

发表您的选型观点,参与即得50金币。

问题状态

  • 发布时间:2020-11-19
  • 关注会员:3 人
  • 问题浏览:1266
  • 最近回答:2020-11-20