云计算建设过程中如何在开发设计前期考虑大规模设备的运维问题?

关于云的建设,个人理解一个主要的目的是利用规模化的普通设备的群体性能去替代甚至是实现高性能设备应对不了的高业务压力场景。所以规模化的设备是一个典型特征,目前看到的很多讨论和实践比较集中在架构设计、开发实现等环节,我是做运维的,关注一些运维相关的具体问题,不是很...显示全部

关于云的建设,个人理解一个主要的目的是利用规模化的普通设备的群体性能去替代甚至是实现高性能设备应对不了的高业务压力场景。所以规模化的设备是一个典型特征,目前看到的很多讨论和实践比较集中在架构设计、开发实现等环节,我是做运维的,关注一些运维相关的具体问题,不是很成熟,请教各位专家:

1.大家在实践过程中是如何在开发设计前期考虑大规模设备的运维问题的,包括故障监控、冗余设计、规模化设备的部署以及配置下发、投产后的变更管理等等,这些问题在开发前期是怎么在设计环节去体现的?

2.大家在实践中如何落实上述问题的,想请教一下各位专家的实践经验。

收起
参与11

查看其它 2 个回答chenjianhui的回答

chenjianhuichenjianhui系统架构师IBM

我觉得云计算的重点是标准化,而不是规模化。规模化有利于降低成本,但云计算为了实现自动化、统一资源分配、计费回收、配置等,更需要的是标准化。单纯机器/设备多是没有用的。

如果做不到标准化,自动化的配置方法、资源划分、应用资源的扩充、迁移,就都做不到。云计算实际上是要通过标准化+自动化,把整个管理过程统一起来,让管理人员可以看到所有的数据和资源,摆脱单纯手工操作。通过收集到的性能数据分析资源需求,通过自动化手段对资源分配进行优化。

对云计算平台来说10台机器和1000台机器的管理应该是一样的,不一样的地方在于,机器多了平均管理成本才会相应下降。

硬件生产 · 2016-11-10
浏览1601

回答者

chenjianhui
系统架构师IBM
擅长领域: 灾备双活云计算

chenjianhui 最近回答过的问题

回答状态

  • 发布时间:2016-11-10
  • 关注会员:5 人
  • 回答浏览:1601
  • X社区推广