如图,一直以来用着的内存都还足够的,最近在尝试一款堡垒机,自从上了堡垒机后已经发生过2次这样的情况了,无法 ssh,用 HMC 连进去也无法执行任何命令,连df -g 都会提示没内存可用。必须强制重启才行。其实也不是说一定就是堡垒机的问题,只是刚刚时间点吻合而已。请问大家这种情况该怎么排错? (目前已撤掉堡垒机,看看是否还有这样的情况,不过可能需要观察的时间就比较长,一般15天或30天才会出现这个内存问题的,之前出现过2次了)
另外,强制重启后,从哪个日志可以看到重启前的进程内存使用情况吗?或者是否会有报错信息说某某进程占用了大量内存?
如果是数据库服务器的话,可分析是否有进行什么数据库方面的变更。可通过nmon收集信息进行内存占用进程分析
目前的操作只能是硬性重启,做好内存监控,跟踪一下。
只有一个图片?
总要把环境说一下吧? 然后下几个命令看看系统运行情况和资源消耗情况吧,,,
这也太扯淡了。。。
有可能是内存真的耗尽了(可能性很小) ; 更多可能是某些程序有问题,,导致内存没有释放出来导致的。
以为拿 nmon 日志分析一下,奈何如上图,今天0点并未生成 nmon 日志,也就是说,10月9日一整天的 nmon 都没了。。。。而我发生这情况,去 HMC 重启这台 AIX 的时间点,就在10月9日早上8点多,我也是醉了。
你要找到根本原因,到底是为什么导致的,光重启没啥用,好好分析一下吧,如果自己分析不了,可以发出来让大家帮助。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30