在大量使用私有云的情况下,私有云承载了大量的计算和存储资源,极端情况下(例如机房停电或者部分电源故障),相当数量的私有云节点宕机下,如何保证剩余的节点能够接管并承载这么大量的计算和存储、内存等资源,以及如何设计?
题目有点大,其实原则上就是设计资源池的时候要考虑应急场景,可以参考DR的风险分析,重点梳理出需要应对哪些场景,说实话,没有能够应对所有场景的高可用设计,因此,必须以场景需求为基础,例如应对单机柜断电,那就把一个集群放到两个机柜里,那要不要跨列放,跨楼放?成本多少,网络开销多少?应对一个百年一遇,值不值得?这是通过风险分析得出的,然后设计相关的高可用,确保在你要应对的场景里,无单点
收起