IBM was 频繁宕机问题?

环境:
ibm 780*2  aix+Oracle rac+was ha  
     去年做过was的升级,但最近没有应用程序的变更,但是最近几天几乎每天22:53出现dump,采集了Javacore和heapdump,也使用了IBM的分析工具IBM HeapAnalyzer还有IBM Thread and Monitor Dump Analyzer for Java自己看了一下,但是因为是自学,之前是硬件维护工程师,几乎是小白。老实说没怎么看懂。现在将相关heapdump和javacore附在百度盘上吧,没法上传可能过大了吧,链接:https://pan.baidu.com/s/1S2GcEd0xoST8G41rNnpikA
提取码:ab12
复制这段内容后打开百度网盘手机App,操作更方便哦想请教大神们帮我分析一下。不胜感激!

参与6
  • 的确比较奇怪,就是在11-09,,11-11,,11-12,11-16,,11-17晚上的22:32都有报错和dump,但是到这两天又没有了,而且硬件也进行了排查。ibm aix 和neapp存储几乎每天都会进行检查。而且在javacore和heapdump也看到是内存溢出呢具体可以看我上传的日志
    2020-11-21

1同行回答

沈天真沈天真  售前支持 , IPS
理解这个故障总是在某个特定时间点发生 ?wierd;通常问题定位都是从最底层开始,一层一层向上排查。1. 先排除是否是硬件故障;观察780上各项资源利用率,是否有资源不足;收集硬件告警信息,是否有告警信息,例如 CPU ,内存,磁盘,网络;2. 排除是否是AIX操作系统层面问题,收集操作系统...显示全部

理解这个故障总是在某个特定时间点发生 ?wierd;
通常问题定位都是从最底层开始,一层一层向上排查。
1. 先排除是否是硬件故障;观察780上各项资源利用率,是否有资源不足;收集硬件告警信息,是否有告警信息,例如 CPU ,内存,磁盘,网络;
2. 排除是否是AIX操作系统层面问题,收集操作系统的日志信息,查看是否有异常。
3. 看看是否是由于WAS引起,看看升级前后WAS版本的差异,查看WAS日志信息,是否有明显的提示
4. 看看应用程序是否有类似日志信息,或者调试信息,查看是否有异常
5. 最后再来看看JavaCore这类的

收起
硬件生产 · 2020-11-20

提问者

水深火热的仲夏
工程师某科技公司
擅长领域: 服务器前置系统数据库

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2020-11-19
  • 关注会员:3 人
  • 问题浏览:3096
  • 最近回答:2020-11-20
  • X社区推广