紧急求助:线程WebContainer : 已活动了毫秒,可能被挂起

最近webspher服务过两天出现以下问题,又不能总是重启服务,程序也多次检查了,没发现问题,搞得很是郁闷!请高手指教!一般应该是什么问题呢?


[09-5-5 10:25:26:628 CST] 0000000e ThreadMonitor W   WSVR0605W: 线程“WebContainer : 137”(00000adf)已活动了 683415 毫秒,可能被挂起了。服务器中可能总共挂起了 2 个线程。
参与27

27同行回答

mingzhuligongmingzhuligong软件开发工程师同方
个人感觉还是看javacore联合多次问题出现的javacore,看挂起的线程堆栈是不是在做同一件事。显示全部
个人感觉还是看javacore
联合多次问题出现的javacore,看挂起的线程堆栈是不是在做同一件事。收起
互联网服务 · 2015-05-28
浏览1435
vincent0417vincent0417高级经理中信银行
IBM_CS_THREAD_SCHED_DETECT_PERIOD 参数决定延迟检测线程多长时间运行一次.默认值是30秒.IBM_CS_THREAD_SCHED_DETECT_ERROR 参数决定多长时间的延迟需要被用这个警告信息记录在日志中.其实这个方法只是用于优化系统消除线程调度延迟,不解决实际问题,具体的可能需要javaco...显示全部
IBM_CS_THREAD_SCHED_DETECT_PERIOD 参数决定延迟检测线程多长时间运行一次.默认值是30秒.
IBM_CS_THREAD_SCHED_DETECT_ERROR 参数决定多长时间的延迟需要被用这个警告信息记录在日志中.
其实这个方法只是用于优化系统消除线程调度延迟,不解决实际问题,具体的可能需要javacore来做进一步定位收起
银行 · 2012-05-09
浏览1374
user4netuser4netStaff software engineerIBM
关于司令给的参数介绍参考下面的官方文档:http://www-01.ibm.com/support/docview.wss?uid=swg21236327这其实是治标不治本的做法,正确思路还是应该看系统到底堵在哪儿了。在问题发生时候kill 几个javacore,很快就能看到是什么线程hang住了,然后分析室应用的还是websphere自...显示全部
关于司令给的参数介绍参考下面的官方文档:
http://www-01.ibm.com/support/docview.wss?uid=swg21236327

这其实是治标不治本的做法,正确思路还是应该看系统到底堵在哪儿了。在问题发生时候kill 几个javacore,很快就能看到是什么线程hang住了,然后分析室应用的还是websphere自己的。收起
2012-03-10
浏览1362
我曾经碰到过一次线程挂起的情况,属于was web container的BUG,在版本6.1上会出现。不知道楼主的问题现象是什么,SystemErr和SystemOut详细日志看看。我那次的解决方法是:在webcontainer custom property中添加参数:com.ibm.ws.webcontainer.channelwritetype=sync 或者打补丁:P...显示全部
我曾经碰到过一次线程挂起的情况,属于was web container的BUG,在版本6.1上会出现。
不知道楼主的问题现象是什么,SystemErr和SystemOut详细日志看看。
我那次的解决方法是:
在webcontainer custom property中添加参数:
com.ibm.ws.webcontainer.channelwritetype=sync
或者打补丁:PK72336
参考资料:
http://www-01.ibm.com/support/docview.wss?rs=0&uid=swg24020800


另外也可能是程序问题,导致事务陷入死循环之类的,这类可以通过检测试试:
1.应用服务应该是正常,比如应用程序的其它功能点正常
2.cpu占用资源比较多,至少有一个core是高负荷
这类情况的话,建议打开trace日志复现问题,并从javacore文件着手,看看应用程序到底在做什么

当然还得排除数据源和数据库的问题,这个可以通过其它应用程序连接到同一DB测试排除收起
2009-09-16
浏览1427
seaairlandseaairland开发工程师boco
这个要具体问题具体分析显示全部
这个要具体问题具体分析收起
电信设备制造商 · 2009-09-16
浏览1387
benson_liubenson_liu技术经理IT
需要日志和javacore文件显示全部
需要日志和javacore文件收起
IT分销/经销 · 2009-07-03
浏览1418
haolxhaolx软件开发工程师京华信息
原帖由 limanbing 于 2009-5-26 13:20 发表 参数调整起来相对好办些,斑竹能否开个讲座,专门介绍下如何分析日志,找到代码中的“真凶”呀 顶一下 这位仁兄  期待这种讲座的出现 ^_^显示全部
原帖由 limanbing 于 2009-5-26 13:20 发表


参数调整起来相对好办些,斑竹能否开个讲座,专门介绍下如何分析日志,找到代码中的“真凶”呀

顶一下 这位仁兄  期待这种讲座的出现 ^_^收起
政府机关 · 2009-06-22
浏览1379
隋鹏飞隋鹏飞软件工程师IBM
楼上说的没错, 线程挂起的可能有很多,先用kill -3 杀一个java dump下来看看, 查找里面的 WebContainer : 137 在干什么,为什么会被挂起这么长时间,然后对具体的问题进行诊断。显示全部
楼上说的没错, 线程挂起的可能有很多,先用kill -3 杀一个java dump下来看看, 查找里面的 WebContainer : 137 在干什么,为什么会被挂起这么长时间,然后对具体的问题进行诊断。收起
2009-06-21
浏览1375
nabainabai产品经理鹰利科技
哇,这个复杂了线程挂起的的原因还是很多的,大概以下几点,可慢慢尝试排除: 1、程序出现死循环,这个检查一下cpu使用率,要是Cpu使用率到达100%,就有可能这个原因;2、程序所用之sql问题,长时间无返回导致线程挂起,检查一下数据库服务器是否有这样的session,顺便问下你用的什么数据库;3、...显示全部
哇,这个复杂了
线程挂起的的原因还是很多的,大概以下几点,可慢慢尝试排除:
1、程序出现死循环,这个检查一下cpu使用率,要是Cpu使用率到达100%,就有可能这个原因;
2、程序所用之sql问题,长时间无返回导致线程挂起,检查一下数据库服务器是否有这样的session,顺便问下你用的什么数据库;
3、HeapSize设置问题,太小会导致垃圾回收频繁,导致反应过慢,这个也常常导致Cpu使用率极高,最后搞到java core dump了,你可以dump文件传上来让大家看一眼;调整的话Max HeapSize你可以调到1G看看,前提是要看你有多少内存了,如果只有2g你就不要乱来了。
4、有些人认为和线程池大小有关,看你的Log如果只有2个线程挂起就导致系统无法连接的话,可以尝试把最大线程提高点看看了,可以到 “应用程序服务器-》server_name-》线程池-》WebContainer ”去调整
5、如果生成了dump文件的话,就可以分析文件,更准确一些;

不过基本上来讲,大家的意见是应该算一致的,调整参数可以减缓挂掉的频率,要彻底解决应该从应用程序着手收起
互联网服务 · 2009-05-26
浏览1436
limanbinglimanbingbutonebutone
参数调整起来相对好办些,斑竹能否开个讲座,专门介绍下如何分析日志,找到代码中的“真凶”呀显示全部
参数调整起来相对好办些,斑竹能否开个讲座,专门介绍下如何分析日志,找到代码中的“真凶”呀收起
2009-05-26
浏览1385

提问者

bront
sephy

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2009-05-05
  • 关注会员:0 人
  • 问题浏览:36154
  • 最近回答:2015-05-28
  • X社区推广