OOM的随机性挂起问题

1、系统基本情况    这是一个协同办公的应用,IBM Power小机两台(AIX6.1),分别运行DB2v9.5,WAS7.0。2、故障描述    前期运行基本正常,一个多月前系统开始随机性挂起,出现频率大概在与个月3次左右,发生时间均在上午9点左右的系统访问高峰期。其中两次重启WAS...显示全部
1、系统基本情况
    这是一个协同办公的应用,IBM Power小机两台(AIX6.1),分别运行DB2v9.5,WAS7.0。
2、故障描述
    前期运行基本正常,一个多月前系统开始随机性挂起,出现频率大概在与个月3次左右,发生时间均在上午9点左右的系统访问高峰期。其中两次重启WAS后恢复正常,一次重启wAS后故障仍在,重启数据库后正常。随后作了一个垂直集群,开了两个WAS成员,10来天了,没有出现整个系统挂掉的情况,但有部分功能(基本上都是涉及附件的)不时出现问题,后台日志中出现内存溢出、栈溢出、本机内存耗尽、无法创建线程等错误。而小机经调整配置后尚有20多G空闲内存,CPU利用率也在10%以内。我估计是压力问题,估计高峰期并发用户在800-1100之间,根据session数判断(不知还有什么更准确的方法)
3、求解问题
    a、这种情况的解决思路是什么?
    b、解决问题的具体步骤如何?
    c、再增加集群的成员有助问题的解决吗?收起
参与11

查看其它 6 个回答liyuheng的回答

liyuhengliyuheng系统工程师东莞都市丽人工业园
回复 2# guansnow

自己通过什么工具能对dump和core文件进行比较直观的分析呢
零售/批发 · 2013-07-17
浏览919

回答者

liyuheng
系统工程师东莞都市丽人工业园
擅长领域: 应用服务器服务器WAS

liyuheng 最近回答过的问题

回答状态

  • 发布时间:2013-07-17
  • 关注会员:1 人
  • 回答浏览:919
  • X社区推广