如题,有没有好的经验分享一下??
关于故障的排查,不同类型的故障会有不同的切入点。故障不明确很难找到准确的切入点。一般是从报警日志中去找切入点。举个例子,比如说发现一个虚拟机HA失败,除了从日志中寻找线索。还可以考虑去检查以下几个方面:
1 存储是否已经在源和目标宿主机上共享并没有问题?
2 目标宿主机上在故障时刻的资源剩余是否足够支撑虚拟机的启动?
3 从VC上查看集群的HA状态是否正常,虚拟机的Vmtools是否异常?
4 是否是个例?那么虚拟机本身是否有文件系统损坏之类的问题?
等等.....
1、网络是否正常
2、存储是否正常
3、集群是否正常开启
很多时候要先看一下环境是否支持自动切换,包括是否自动切换或者手工切换等
资源是不是足够,比如有的时候一下停掉2到3个宿主机,要想一下切换到其他的机器上基本上是不可能的。以前遇到过一次。
什么情况都不是万能的。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30