云计算建设过程中如何在开发设计前期考虑大规模设备的运维问题?

关于云的建设,个人理解一个主要的目的是利用规模化的普通设备的群体性能去替代甚至是实现高性能设备应对不了的高业务压力场景。所以规模化的设备是一个典型特征,目前看到的很多讨论和实践比较集中在架构设计、开发实现等环节,我是做运维的,关注一些运维相关的具体问题,不是很...显示全部

关于云的建设,个人理解一个主要的目的是利用规模化的普通设备的群体性能去替代甚至是实现高性能设备应对不了的高业务压力场景。所以规模化的设备是一个典型特征,目前看到的很多讨论和实践比较集中在架构设计、开发实现等环节,我是做运维的,关注一些运维相关的具体问题,不是很成熟,请教各位专家:

1.大家在实践过程中是如何在开发设计前期考虑大规模设备的运维问题的,包括故障监控、冗余设计、规模化设备的部署以及配置下发、投产后的变更管理等等,这些问题在开发前期是怎么在设计环节去体现的?

2.大家在实践中如何落实上述问题的,想请教一下各位专家的实践经验。

收起
参与11

查看其它 2 个回答傻点好的回答

傻点好傻点好系统架构师某国有银行

可以这么理解,精髓是设备规模化了,计算分布式了,以前集中式的单机计算不适用于虚拟化环境,那么问题来了,从运维看,一定是多了好多好多的机器,运维复杂度提升的感觉,规划和设计不好,一定是这个结果的,运维累死,应用层影响小。其实是可靠性下降,可用性提升的必然。那么,如何前期设计解决运维的苦,几个经验分享

设备标准化,这个带来就是整体效率的提升,不论建设效率,采购效率,兼容性等等。

设备自动化,云管理平台就是解决大量设备运维复杂的利器,通过远程端口实现安装,重启等功能,全面监控和事件管理

容量精细化,容量上一定要根据自身的运维能力设阈值,这个是经常被忽略的,有的团队用好工具可以支持池子的机器70%使用率,有的可能只能支持50%的使用率,为什么?运维响应时间不一样啊,等级不一样啊,越高,运维工具和团队的要求和工作量就越高

银行 · 2016-11-10
浏览1536

回答者

傻点好
系统架构师某国有银行
擅长领域: 云计算私有云服务器

傻点好 最近回答过的问题

回答状态

  • 发布时间:2016-11-10
  • 关注会员:5 人
  • 回答浏览:1536
  • X社区推广