可以这么理解,精髓是设备规模化了,计算分布式了,以前集中式的单机计算不适用于虚拟化环境,那么问题来了,从运维看,一定是多了好多好多的机器,运维复杂度提升的感觉,规划和设计不好,一定是这个结果的,运维累死,应用层影响小。其实是可靠性下降,可用性提升的必然。那么,如何前期设计解决运维的苦,几个经验分享
设备标准化,这个带来就是整体效率的提升,不论建设效率,采购效率,兼容性等等。
设备自动化,云管理平台就是解决大量设备运维复杂的利器,通过远程端口实现安装,重启等功能,全面监控和事件管理
容量精细化,容量上一定要根据自身的运维能力设阈值,这个是经常被忽略的,有的团队用好工具可以支持池子的机器70%使用率,有的可能只能支持50%的使用率,为什么?运维响应时间不一样啊,等级不一样啊,越高,运维工具和团队的要求和工作量就越高