系统版本要一致,然后手动mount /var 目录后试试
故障灯亮了不代表系统不能运行啊,先看看系统能不能起来再说其他的。 系统和asm都有日志可以仔细看看。
经常看到有人在hmc 配置了错误导致系统启动到诊断模式。
经常遇到aix无法启动,但又不知道pending在哪,因此打开启动过程的debug模式,对于诊断问题有很大的帮帮助。下面是打开debug的方法:打开启动debug先进入微码模式(启动界面中输入8)boot -s trap进入kdbdbgopt选择要debug的内容重新进入kdb输入g...
(more)有如下思路:(1) 多路径的报错,如果很快就恢复的话,有可能是san网络闪断导致的。请检查一下san交换机的error数量,看看有没有增长。(2) 检查一下存储,看看存储的控制器是否有问题(3) 观察一下,每次发生故障的链路是否是相同的,看看光纤卡是否有问题。...
系统为:CentOS release 6.8 (Final),内核:2.6.32-642.13.1.el6.x86_64,内存:8G,有时候系统会自动kill掉进程,日志提示:Out of memory: Kill process 10660 (java) score 685 or sacrifice child,网上百度的没能解决问题,还望各位大神指点,谢谢!(而且适用的系统是rhel 4)1、如果可能,请升...
(more)bug引起的宕机,是由于某种原因触发了这个bug,升级补丁吧!
这个最好从was层面分析。heapdump 文件:IBM 的 HeapAnalyzer javacore 文件: IBM Thread and Monitor Dump Analyzer for Java
首先可以看一下技术业界衡量公司运维自动化程度的一个标准:xx台服务器/工程师,对于Google, Facebook这些技术比较牛的公司,单个运维工程师负责的服务器一般在1w+,甚至会更多。这其中,自然离不开的一个特性,那就是运维高度自动化、智能化、平台化。上图是一个经典的自动化运维体系...