软件开发WAS 7CPU饥饿

cpu 饥饿,当前线程调度被延迟

软件名称:websphere ND

软件版本:7.0.0.11

环境平台:solaris 10

问题描述:偶尔出现 CPU饥饿 , 集群中的一个成员出现这种情况,导致所有的应用卡住,慢得很。
         [10-6-29 10:47:56:234 CST] 0000003c CoordinatorCo W   HMGR0152W: 检测到 CPU 饥饿。当前线程调度延迟是 30 秒。
[10-6-29 10:48:17:844 CST] 00000011 ApplicationMo W   DCSV0004W: 在成员 t5app1Cell01t5app1Node01cdcin_02 处的 DCS 堆栈 DefaultCoreGroup:未接收到足够的 CPU 时间片。在 10:46:55:803 CST 处的上次已知 CPU 使用时间。保持不活动状态的持续时间为 46 秒。
   Sun SPARC Enterprise T5240 服务器,物理硬件还不错,每个集群成员堆最小1024M 最大2048M. 排除物理硬件有问题.
参与16

14同行回答

tictactictaccaitcait
HMGR0152W信息报出说明这个进程中存在JVM线程调度延迟。WebSphere Application Server高可用管理器组件中包含线程调度延迟检测逻辑,它会周期性的启动一个线程, 用这个线程去跟踪是否线程已经被分派,是否按照计划运行。默认情况下,延迟检测线程每30秒钟运行一次, 如果超过计...显示全部
HMGR0152W信息报出说明这个进程中存在JVM线程调度延迟。

WebSphere Application Server高可用管理器组件中包含线程调度延迟检测逻辑,它会周期性的启动一个线程, 用这个线程去跟踪是否线程已经被分派,是否按照计划运行。默认情况下,延迟检测线程每30秒钟运行一次, 如果超过计划5秒钟没有运行就会在日志中记录一条HMGR0152W消息。这条消息显示了延迟的时间或者与该线程期望得到CPU和实际得到CPU的时间差。

HMGR0152W甚至可能在CPU资源可用的情况下报出。有很多原因可能导致这个调度线程不能以适时的方式获得CPU.下面是一些常见的原因:

1. 物理内存被过量使用并且产生了分页.

2. 进程的堆大小太小导致垃圾回收频繁或者过长阻塞了其他线程的执行.

3. 系统中运行着太多线程,负载过高可能导致CPU使用过高.
HMGR0152W警告信息试图告诉您出现了一个如果不及时修正可能导致不稳定的情况.您需要分析为什么调度线程发生了延迟,需要采取哪些措施.下面是一些常用的解决方法:
1. 增加无力内存防止分页.
2. 优化JVM堆内存配置,从而优化垃圾回收.
3. 降低系统的整体负载到一个可以接受的值.
如果HMGR0152W信息不是经常报出,并且从报出的消息看延迟很短(例如小于20秒), 通常不会有其他问题发生,这个时候这个消息可以被忽略.

高可用管理线程调度延迟检测可以通过配置下面两个定制属性中的一个来实现:
1. IBM_CS_THREAD_SCHED_DETECT_PERIOD 参数决定延迟检测线程多长时间运行一次.默认值是30秒.
2. IBM_CS_THREAD_SCHED_DETECT_ERROR 参数决定多长时间的延迟需要被用这个警告信息记录在日志中.

这些属性辖域在核心组上,您可以按照如下方法配置:
1. 在管理控制台中, 点击服务器 > 核心组 > 核心组设置, 然后选择核心组名字.
2. 在其它属性下, 点击定制属性 > 新建.
3. 输入属性名和值.
4. 保存配置.
5. 如果是网络部署环境, 请注意同步所有节点.
6. 重新启动所有的服务器是该配置在该服务器上生效.

虽然我们可以用上面两个属性增加线程调度检测时间, 但是不建议通过它们使HMGR0152W警告消息完全不再报出. 这个方法只是用于优化系统消除线程调度延迟.收起
2011-05-23
浏览5520
javasonjavason软件架构设计师chinacreator
PID如何找到,一般在日志文件所在的文件夹下,会有一个.pid的文件,这个里面的数值就是当前server的PID显示全部
PID如何找到,一般在日志文件所在的文件夹下,会有一个.pid的文件,这个里面的数值就是当前server的PID收起
互联网服务 · 2011-03-17
浏览5505
designleedesignlee系统管理员上海infoservice
生成javacore出了问题invoke $jvm dumpThreadsWASX7015E: 运行命令时发生异常:“$AdminControl invoke $jvm dumpThreads”;异常信息:com.ibm.ws.scripting.ScriptingException: WASX7025E: 字符串“”中发现错误;无法创建 ObjectName--------------------------------------...显示全部
生成javacore出了问题
invoke $jvm dumpThreads
WASX7015E: 运行命令时发生异常:“$AdminControl invoke $jvm dumpThreads”;异常信息:
com.ibm.ws.scripting.ScriptingException: WASX7025E: 字符串“”中发现错误;无法创建 ObjectName
----------------------------------------------------------
应该是节点停掉了,重新启动一下收起
机械装备 · 2010-11-17
浏览5550
YuLiminYuLimin资深技术顾问IBM广州
在native_stderr.log里显示全部
在native_stderr.log里收起
互联网服务 · 2010-07-10
浏览5462
yayohoyayoho软件架构设计师金证股份
在集群中的一个成员下面找到有个pid文件,里面有个PID号,与当前ps -ef|grep java中的一个PID是一样的kill -3 后,没看到生成的javacore文件,不知道存放在什么位置?生成这些文件还需要那些条件显示全部
在集群中的一个成员下面找到有个pid文件,里面有个PID号,与当前ps -ef|grep java中的一个PID是一样的
kill -3 后,没看到生成的javacore文件,不知道存放在什么位置?生成这些文件还需要那些条件收起
软件开发 · 2010-07-10
浏览5639
yayohoyayoho软件架构设计师金证股份
不用进wsadmin吗? 现在有个集群,怎么查找PID,显示全部
不用进wsadmin吗? 现在有个集群,怎么查找PID,收起
软件开发 · 2010-07-09
浏览5627
YuLiminYuLimin资深技术顾问IBM广州
Solairs下,直接kill -3 即可了。显示全部
Solairs下,直接kill -3 即可了。收起
互联网服务 · 2010-07-05
浏览5636
yayohoyayoho软件架构设计师金证股份
最后一步$AdminControl invoke $jvm dumpThreads执行的时候出错显示全部
最后一步$AdminControl invoke $jvm dumpThreads执行的时候出错收起
软件开发 · 2010-07-05
浏览5622
YuLiminYuLimin资深技术顾问IBM广州
#启动wsadminwsadmin -user xxx -password xxx#设置JVM环境变量set jvm [$AdminControl completeObjectName type=JVM,process=server1,*]#生成JavaCore文件$AdminControl invoke $jvm dumpThreads显示全部
#启动wsadmin
wsadmin -user xxx -password xxx

#设置JVM环境变量
set jvm [$AdminControl completeObjectName type=JVM,process=server1,*]

#生成JavaCore文件
$AdminControl invoke $jvm dumpThreads收起
互联网服务 · 2010-07-03
浏览5646
yayohoyayoho软件架构设计师金证股份
生成javacore出了问题invoke $jvm dumpThreadsWASX7015E: 运行命令时发生异常:“$AdminControl invoke $jvm dumpThreads”;异常信息:com.ibm.ws.scripting.ScriptingException: WASX7025E: 字符串“”中发现错误;无法创建 ObjectName...显示全部
生成javacore出了问题
invoke $jvm dumpThreads
WASX7015E: 运行命令时发生异常:“$AdminControl invoke $jvm dumpThreads”;异常信息:
com.ibm.ws.scripting.ScriptingException: WASX7025E: 字符串“”中发现错误;无法创建 ObjectName收起
软件开发 · 2010-07-02
浏览5590

提问者

yayoho
软件架构设计师金证股份

问题状态

  • 发布时间:2010-06-30
  • 关注会员:1 人
  • 问题浏览:21966
  • 最近回答:2011-05-23
  • X社区推广