OOM的随机性挂起问题

1、系统基本情况    这是一个协同办公的应用,IBM Power小机两台(AIX6.1),分别运行DB2v9.5,WAS7.0。2、故障描述    前期运行基本正常,一个多月前系统开始随机性挂起,出现频率大概在与个月3次左右,发生时间均在上午9点左右的系统访问高峰期。其中两次重启WAS...显示全部
1、系统基本情况
    这是一个协同办公的应用,IBM Power小机两台(AIX6.1),分别运行DB2v9.5,WAS7.0。
2、故障描述
    前期运行基本正常,一个多月前系统开始随机性挂起,出现频率大概在与个月3次左右,发生时间均在上午9点左右的系统访问高峰期。其中两次重启WAS后恢复正常,一次重启wAS后故障仍在,重启数据库后正常。随后作了一个垂直集群,开了两个WAS成员,10来天了,没有出现整个系统挂掉的情况,但有部分功能(基本上都是涉及附件的)不时出现问题,后台日志中出现内存溢出、栈溢出、本机内存耗尽、无法创建线程等错误。而小机经调整配置后尚有20多G空闲内存,CPU利用率也在10%以内。我估计是压力问题,估计高峰期并发用户在800-1100之间,根据session数判断(不知还有什么更准确的方法)
3、求解问题
    a、这种情况的解决思路是什么?
    b、解决问题的具体步骤如何?
    c、再增加集群的成员有助问题的解决吗?收起
参与11

查看其它 6 个回答guansnow的回答

guansnowguansnow系统分析师科大讯飞
肯定是隐式内存泄漏,建议关掉PMI,自己截DUMP和CORE文件分析分析
系统集成 · 2013-07-17
浏览874

回答者

guansnow
系统分析师科大讯飞
擅长领域: 中间件服务器前置系统

guansnow 最近回答过的问题

回答状态

  • 发布时间:2013-07-17
  • 关注会员:1 人
  • 回答浏览:874
  • X社区推广