关于故障的排查,不同类型的故障会有不同的切入点。故障不明确很难找到准确的切入点。一般是从报警日志中去找切入点。举个例子,比如说发现一个虚拟机HA失败,除了从日志中寻找线索。还可以考虑去检查以下几个方面:1 存储是否已经在源和目标宿主机上共享并没有问题?2 目标宿主机...
不知道其他兄弟有没有最佳实践,我说一下平时维护需要注意的地方:查看现象,了解一下前因后果,定位影响业务的范围和重要性。根据第1步骤,尤其业务系统重要性方面,比如要求系统及时恢复,那么可能简单的收集一下日志,做一下认为重要的记录,开始供电异常,还是dump文件,直接重新启动看看...
mongodb和redis有提供docker的image同意楼上,不建议在docker来部署数据库,这样的话,可能遇到因docker引起的未知问题,而且问题很难排查。尤其在集群的情况下,之间的通讯也变得复杂了。数据库优先建议放在物理机上,非核心的系统可以放在虚拟机上。...