对于计算节点高可用来讲,除了在资源数量上要保证其冗余性之外,策略设置也非常重要。可以参考以下几个点:
1 Admission Control Policy:对于生产环境来讲,一般认为选择(Host Failure the cluster tolerates =1)比较合适,当然如果你的资源非常空闲,可以适当调大。
2 对于每一台物理机上的虚拟机根据其重要程度不同,设置其启动的优先级(高中低)。
3 当一台物理机上的虚拟机远超过集群当中的物理机数量时,可以考虑设置虚拟机HA互斥分离规则。
4 生产环境当中尽量把DRS的策略设置的不要太激进。尤其是前段具有负载均衡设备的时候建议把DRS打成建议模式。
对于存储来讲,必须保证集群内所有节点看到的外部存储视图是一样的,完全共享的,才能很好保证其HA及DRS功能。另外说到存储,有以下几个点:
1 卷属性里面,把Storage IO Control 选项Disable。不建议vwmare层干预底层IO,反而有尤其性能故障的风险。
2 将卷的多路劲策略设置为(Round Robin)。
收起VMware提供了VMware HA和FT两种高可用,但只能做到esxi主机级别的故障监测和恢复。一般会从应用级别上来做高可用,根据不同的业务角色,使用相应的群集或负载均衡,对于后端数据库角色,一般会部署在物理机上,如果非要在虚拟机上可以考虑veritas公司的infoscale系列中的群集软件(原vcs),可以与VMware的vmotion和其他管理手段有联动,也可以不需要裸设备等支持来避免脑裂,还支持不同优先级的应用按指定顺序启停。同类群集基本只能做到基础的功能。
收起我看问题问的是 VMware网络虚拟化平台的高可用性问题,这个问题的对象是NSX产品,我看楼上各位老师的回答都是在讲vSphere 的高可用性,这岂不是答非所问?
VMware 的NSX 是SDDC软件定义数据中心的一款产品,它把控制平面和数据平面分离,控制层面出现问题不会影响数据层面的可用性。
控制层面的controller VM 最多可以部署3台,保证可用性。
DLR的控制虚拟机可以部署为HA模式。一主一备。
ESG的边界网关设备也支持HA模式,还可以通过ECMP 协议做负载均衡,最多部署8台。
以我们的应用环境为例,有多组虚拟服务器和刀片服务器构成。先根据业务需求,通过多台物理服务器(我们有2台和4台两个esxi主机环境),做基于esxi主机级别高可靠部署;然后在部署具体应用时,比如做集群环境的部署时,分别通过不同虚拟环境下的服务器或者通过与刀片服务器组成集群环境来提高高可靠性的保证。
收起