宿主机配置拉高,虚拟机的密度必然增大,遇到宿主机宕机的极端情况,HA切换的时间也可能会相应的延长。虽然现在虚拟化层针对HA的机制更加智能了,能序列化、并发进行,但是单台宿主机上虚拟机的密度变大,故障和风险的影响范围必然扩大不少,潜在隐患风险系数自然高。
几个经验性的建议:
1,将宿主机分成多个逻辑集群,核心业务部署在高规格集群,虚拟机密度适当降低。非核心业务部署在中低规格集群,预留充足的HA资源。
2,业务集群化部署,至少2节点部署。同时指定亲和性策略,将同一个业务的几台虚拟机分配到不同的物理节点上。同一类型的业务,不要同时放到同一区域/片区的宿主机上,避免突发极端情况,该类业务全线凉凉。
3,禁用DRS之类的功能,手工指定分配宿主机资源,如果对HA要求高,单独针对不同级别的业务制定配置HA策略。