超融合节点由于授权较贵,会尽量采购较高配置宿主机,运行虚拟机密度较高,普遍超过20+ VM每节点。如果宿主机异常重启,是否会影响集群运行稳定(HA自动在集群其他节点拉起业务虚拟机数量较大)。同时,多虚拟机通过HA重启,将导致业务中断影响风险增加。证券行业业务连续续要求较高,如何降低这类风险?
我自己考虑的解决办法似乎只能降低虚拟机密度,每节点10+ VM,同时采用虚拟机反亲和配置,将主备、双活应用虚拟机分散放置来降低风险,最好建设多个超融合集群,确保应用分散在不同集群运行。
不清楚是否还有更好的解决办法?各位同行是否可提供点建议,谢谢。
以4节点的超融合为例,如果4台机器上的虚拟机资源消耗超过了3/4.那么。当一个节点重启的时候必然会有一部分虚拟机的资源无法的到满足而产生影响。可以通过对业务的分级来调整。比如把重要业务和不重要的业务划分开。通过策略实现当某个节点挂掉的时候优先保证重要业务。
另外还有一种就是尽可能的保证系统资源占用预留一个节点以上。保证任何一个节点重启时业务不受影响。
定期巡检。保障机房动力及环境也是超融合架构域内的重要环节。一方面不出问题。一方面就是保障出问题后的应急预案。
针对您提出的问题,我认为您的解决方案是可行的。但是,如果您想进一步降低风险,可以考虑以下几点建议:
希望以上建议能够对您有所帮助。