本质上这是一个:企业IT基础设施发展规划问题。
背景介绍
aws作为云计算的鼻祖,将云计算推到全世界,在aws的认证中有句话是这么说的:以服务的形式通过互联网向用户提供资源,并按需收费。这是aws对云计算的定义。现在的云计算也确实已经发展到“全民上云”,政府,企业,甚至个人都在使用云计算的产品或者能力,云计算一片欣欣向荣。
自从2004年IBM开始推动把解决方案作为开拓市场的利器之后,用户开始由固定接收产品能力到提出自己需求,让提供方进行定制转变。云也一样:包括现在的aws,azure,ali,腾讯,华为等没有一家不是在通过解决方案的方式向企业输出自己的云平台。为了满足用户的需求出现了各种云:公有云,私有云,混合云,团体云(金融云)等,无一不是在引导用户“上云”,。
接下来,从如下几个方面进行简单分析,期望对大家有帮助:
- 为什么要建设云平台
在讨论企业为什么要建设云平台之前,先看看企业没有云平台的状况: - IOE的时代:成本高,绑定深,资源利用率低。当然不是说有了云平台才干掉IOE,此处只是说说痛点。
- 以vCenter,Citrix等技术完成计算资源虚拟化:成本依然高(主要是硬件,授权,服务费),但是一定程度上解决了资源利用率低的问题:一台物理机可以虚拟化为多台虚机,分给不同的业务团队和业务系统使用。
- X86+开源:企业好像一下子变高富帅了,从待宰羔羊,变“大爷”了。但是X86可是不会像你想象的那么坚挺,会发生故障的,尤其是磁盘故障;开源不是说你有代码就可以为所欲为,要看自己有没有“刷子”的。技术架构从集中式向分布式转变,解决了硬件成本,性能瓶颈等问题;也带来了更多的问题,需要更多的专业技术人才(CAP理论可以作为分布式入门的一个敲门砖,有兴趣的同学可以深入了解)。
- 资源管理:集中式管理,例如:分配虚机,配置网络等;以命令,脚本为主,缺乏web化管理,依赖各产品或技术组件原生界面。效率奇低,且容易出错。
- 监控告警:监控工具以开源为主,难以满足企业需求;告警方式多样,需要与监控集成,这些很难通过一个产品解决所有问题,甚至需要定制;
- 运维:随着业务发展,业务系统增多,基础设施投入变大,提供厂家变多,以及各类技术的使用,使得运维工作消耗更多的精力,甚至需要投入复合型人才进行运维;
如上只是企业的部分痛点,为了解决这些痛点,企业需要具备如下能力的平台:
- 满足企业数字化转型的IT架构,打破传统基础架构带来的各种壁垒;
- 满足业务快速发展对基础资源需要,高效快捷的资源生命周期管理平台:实现资源分配、使用、回收的流程管理;
- 统一视角的基础设施管理能力:屏蔽底层技术架构的差异;
- 丰富的面向业务研发人员的服务能力:快速部署环境;
此时,云平台出场了,他解决了以上的大部分问题,并且经过云厂商的包装,变得“无所不能”。为了能更好地将云平台让企业主们听得懂,很多专家包括解决方案工程师们开始有层次地讲:IaaS,PaaS,SaaS等(不是说有了云计算才有IaaS,而是说专家们想办法借概念推广云计算)。现在只要听过云计算的应该都听过IaaS,PaaS等概念吧。IaaS可以说是云平台的一部分,是云的底座。
- 企业是否需要云平台?
云平台确实好,但是不是所有的企业都需要呢?说个例子:你家只开个豆腐作坊,需要一台电脑用来完成进货及交易流水,替代用笔记录,完全没必要建设云平台。当然可以买个云服务,电脑都不用买。但是如果是一家拥有几千人甚至几万人的互联网公司,开发各种互联网应用,没有云平台,资源管理的成本直接就拖死这个企业。有很多人会说,这太极端了,还有大部分的企业是制造,金融,交通等企业,有一定规模,怎么衡量是否需要建设云平台呢?个人认为可以从如下几个方面衡量?
- IT在企业业务发展的作用
企业的业务发展依赖科技驱动,或者说需要IT支撑。例如:电商,线上银行等等; - 企业IT成本投入评估
企业只有几十台或者上百台虚机,就算未来业务发展了,IT方面的投入也不会线性增长,不建议建设云平台,可以考虑买云服务(很多人会说云厂商偷数据。实在地说,云提供者不会为了客户的数据,而舍弃自己的命,现在只有担心,偷数据的云厂商还真没听过)。
企业拥有数百台、上千台虚机,甚至租用机房、自建机房的,可以考虑建设云平台;
随着业务发展,IT投入会呈线性增长,甚至出现上开口抛物线发展趋势,基本不用考虑:一定要建设属于自己的云平台。
- 资源效率
在有一定IT规模的企业,使用IT资源方面,效率低于15-20%(只是一个可参考值,不用较真),可以考虑建设云平台,很多人会说这个值也太低了,我给大家举个例子,大家明白这个15-20%到底高不高
新的业务系统要上线,需要申请资源:测试环境虚机N台;提交流程期望半天能完成虚机交付,半天完成服务部署。实际情况:流程审批2-5天不等甚至更久,服务部署:1-3天不等;对虚机的cpu平均使用率:20%不到(如果各位觉得不服,你们可以看看自己企业的虚机cpu资源使用率,达到50%的属于超级高的了;还不信,可以用自己的电脑做衡量);
- 运维监控
如果运维的投入占到IT总投入的:15%甚至更高(不包含固定硬件成本),可以考虑建设云平台。
- 企业怎么建设云平台?
这里只提供方法论的东西,不涉及具体的技术和实践,供大家参考
- 咨询
从集中式到分布式架构转变,是自底向上的架构模式变化,动一发牵全身;从集中管控到云平台,是一种赋能,这种赋能是有学习成本在的。因此,向有经验的同行、企业、甚至咨询机构进行学习是非常必要的。
可以带来很多好处:了解企业自身所在行业的IT建设现状及趋势,了解行业在IT建设上的不足及问题,少走弯路。
- 规划
对企业IT现状进行充分的分析,痛点有哪些,问题在哪里,这些通过咨询可以引进门,但无法替代企业自身去完成;
结合现状考虑解决方案,立足现状,着眼3年甚至更久的可持续性,规划建设方案;
方案规划好后要进行充分论证:为什么这么做,这么做带来的好处彻底想清楚;
让领导层能够坚定支持建设云平台,是非常,非常,非常重要的一环,重点的词咱们讲3遍。 - 组织转型
一旦建云,管理模式和流程会被打破,要围绕整个云平台的建设进行合理的组织架构调整,使云平台的效率最大化。 - 建设及迁移
云平台建成后,由外及内地进行业务迁移:将非核心的业务迁移试用,充分测试后,再考虑核心业务迁移 - 人才培养
云平台需要运维人员,不能所有的事情都依托于云厂商,需要有自己的人才队伍;另外,云平台可以解决大部分问题,但不能完全解决IT中碰到的所有难点,需要有结合云平台外围进行一些辅助工具及平台集成的人才。
如上只是个人浅见。