超融合节点虚拟机密度问题?

 背景超融合节点由于授权较贵,会尽量采购较高配置宿主机,运行虚拟机密度较高,普遍超过20+ VM每节点。如果宿主机异常重启,是否会影响集群运行稳定(HA自动在集群其他节点拉起业务虚拟机数量较大)。同时,多虚拟机通过HA重启,将导致业务中断影响风险增加。证券行业业务连续续要求较...显示全部

 背景

超融合节点由于授权较贵,会尽量采购较高配置宿主机,运行虚拟机密度较高,普遍超过20+ VM每节点。如果宿主机异常重启,是否会影响集群运行稳定(HA自动在集群其他节点拉起业务虚拟机数量较大)。同时,多虚拟机通过HA重启,将导致业务中断影响风险增加。证券行业业务连续续要求较高,如何降低这类风险?

 思考

我自己考虑的解决办法似乎只能降低虚拟机密度,每节点10+ VM,同时采用虚拟机反亲和配置,将主备、双活应用虚拟机分散放置来降低风险,最好建设多个超融合集群,确保应用分散在不同集群运行。

不清楚是否还有更好的解决办法?各位同行是否可提供点建议,谢谢。

收起
参与40

查看其它 7 个回答edwardwu的回答

超融合节点运行的虚拟机数量受到节点计算资源和每个虚拟机计算资源分配的双重影响,节点计算资源越多,单个虚拟机的资源越少,那么节点上的虚拟机数量自然也就越多。超融合节点一般按照CPU槽位进行授权,也可以简单的理解为按照节点进行授权,客户为了节约成本,往往会购买少量的授权,把超融合节点的计算资源配置的很高,来达到部署大量虚拟机的目的,这样必然会导致超融合集群上的虚拟机密度过高,如果这个时候发生节点故障,必然会导致大量的虚拟机HA,影响范围比较广。如果通过部署少量的虚拟机,来控制业务影响的范围,又会造成节点计算资源的浪费,成本反而升高。面对这种情况,我们在进行超融合设施初期建设时就应该合理规划超融合节点上的计算资源,在虚拟机数量和节点计算资源上进行合理的规划,避免虚拟机密度过大的同时,保证计算资源的够用,同时也需要开启资源自动调度,来保证节点上资源的合理分配。后期随着业务增长,需要更多的虚拟机时,我们应当适当的增加集群的节点数量来满足业务需求,而不是在原来的基础上增加计算资源来增加虚拟机密度。

虚拟机密度越小只能控制虚拟机影响的数量,而不能避免影响业务。当集群中节点故障,虚拟机触发HA,必然会引起虚拟机关机并在可用节点重新拉取,导致业务的短暂中断。根据业务的重要性,不可短暂中断的业务,就需要应用层能够做到高可用,当其中一个虚拟机业务出现异常时,其他虚拟机能够承担业务,做到业务不中断,然而这些不同的虚拟机,就需要使用虚拟机放置组,放置到不同的节点,避免节点故障,导致应用层虚拟机不可用,同样我们也可以考虑把虚拟机放置到不同的集群或者同城双活中,避免集群故障,以此来保证业务的可用性。

软件开发 · 2023-08-18
浏览813

回答者

edwardwu
产品经理SmartX超融合
擅长领域: 存储灾备超融合

edwardwu 最近回答过的问题

回答状态

  • 发布时间:2023-08-18
  • 关注会员:9 人
  • 回答浏览:813
  • X社区推广