jxnxsdengyu
作者jxnxsdengyu2020-04-15 12:56
系统工程师, 江西农信

金融企业云管平台20个典型难点探讨总结

字数 18541阅读 10797评论 1赞 13

前言

随着互联网技术的发展,AI、区块链、云计算、大数据等技术方兴未艾;在金融科技化变革的浪潮中,如何把握金融科技发展的脉络,是金融企业立只有紧随科技发展的步伐,不断提升自己的科技能力,才能应对科技日益变化的明天。同时随着银监“十三五”对于云计算架构平台迁移的要求,云平台的建设越显迫切。实现统一的云管平台能够有效整合和利用银行内部多种异构资源,简化内部IT架构,实现设备的全生命周期管理,消除设备使用信息孤岛,降低运维和管理成本,因此如何对现有的IT进行有效的整合和管理是每家金融企业必须要考虑的事情。
建设云管平台首先要考虑的关键问题就是云管平台建设的标准化问题,应该说标准化是实现自动化的前提条件,同时也是实现企业IT建设可持续化发展的必要条件。第三方服务目录标准化、接口标准化对接、各种资源的标准化定义、交付流程的标准化约束等等;只有标准化先行才能保障后续建设的持续进行和提高。
4月7日至4月15日,twt社区组织了四位云管平台领域的社区专家针对“金融企业云管平台架构设计及难点”主题进行了深入的在线探讨,各位专家也各抒己见,为社区会员答疑解惑。下面,笔者就活动的问答情况进行详细总结,如有遗漏和不当之处,还请各位多多包涵。


# 关于云管平台选型问题
【Q1】企业如何选择适应自己基础设施的云平台?云最近很热,但对于我个人来说,对云的理解还是云里雾里的,现在的云都有哪些分类!企业什么时候上云,什么业务适合上云,云和普通的虚拟化有什么区别,上云后对运维团队有什么要求,需要掌握哪些技能,laas层、apaas层,ipaas层,都有哪些区别,上云跟不上云能帮助企业解决哪些问题,有什么些优势。如何对原有的it基础设施进行匹配,保护原有投资。好多问题1比较迷茫,借助这次机会,希望我的这些问题可以解决。感谢这次为我们提供平台的twt社区。感谢分享的嘉宾。
【A】 互联网这两次浪潮之后,云计算成为了引领IT产业的第三次革新浪潮。云计算可以分为三种服务模式。基础设施云服务(IaaS),平台云服务(PaaS),以及软件云服务(SaaS)。其中基础设施云服务是目前应用最广泛的服务,它常独立于运行平台,分担基础设施云服务成本,避免了硬件和人力资源方面的费用。它不但能给用户提供通过网络获得完善的计算机基础设施服务的能力,还是平台云服务和软件云服务的基础。 目前基础设施云服务的服务形式通常是以平台模式呈现,企业通过在云端搭建一套基础设施平台,将它以服务的形式提供给用户。1、技术能力强的可以选型开源+自研。2、商用稳定的可以考虑商用平台。

【Q2】云管平台建设模式?当前主流银行及中小型金融机构云管平台的建设情况,建设模式和发展趋势等 【A1】云管平台,有很多公有云和私有云厂商都设计了自己的云管平台,这个技术并不难。 比如dell emc,easystack,ibm,vmware都有。建设模式: 私有云、公有云,混合云。但也有些小的有名,比如欧电云的雨燕跨云DevOps云管平台,使用Java开发,什么都自己做,很厉害。而且也好多年了(不做广告)。还有入驻twt的青云的iFcloud,你也可以咨询一下网站。发展趋势,说实话很一般,刚开始时,没有人注意,搞这个的开发人员很多都转行了。因为,各家都搞自己的一套,基本上无论是公有云还是私有云都是作为附属品送给客户的,都是作为服务的一部分,基本上没有单卖的。
【A2】 建设模式,国内银行主流还是私有云,公有云也有和阿里、腾讯、华为等大厂合作的,但上到公有云中的应用很少,我们之前就在阿里云上弄了一些资源,当作互联网金融应用的备用资源池。混合云就更少了,尤其是云管还要管理混合云的少之又少。发展趋势吧,就国内银行来说,个人觉得云管往混合云管发展还是受限太大,专有云、私有云、容器云才是主流,目标都是PAAS、SAAS,都是要尽量屏蔽掉底层基础架构,应用和基础技术完全解耦。
【A3】通过云管统一纳管VMware、openstack等异构云,甚至一些公有云。再复杂一些在云管里纳管k8s/openshift这些容器云平台。另外对接CMDB等。

【Q3】云管平台国产产品与国际产品的选择考虑?针对市场上的云管产品,云平台建设方案,目前我们考虑的仍然是技术的实现,但是面对当前国际局势,我们是不是有必要考虑国产产品的使用,目前我们去考虑国产化问题是不是杞人忧天?国产产品对比国外产品的优劣势有哪些,是否有稍微具体些的分析。
【A1】 云管平台没有必要选择国外产品,而且国外产品未必符合国人的使用习惯,定制化开发很麻烦。相反国内云管平台对于使用者来说更方便,特别是定制化需求的响应能力国产要比国外强。在选择产品的时候一定要考虑售后和技术支持能力,这个很关键。
【A2】 个人认为,目前国内产品还是主流,国外产品很多也都国内化了。国内产品的质量还是可以的,国外产品有些设计理念和国内用户需求有些偏差,部分功能存在溢出现象,而国内产品充分考虑到国内用户使用习惯和国人认可的UI设计,会更贴切用户一些。
【A3】国产云管产品能全面支持国产化软件、硬件的安装部署和管理、支持国产化软件ARM服务器纳管;支持在中标麒麟、银河麒麟操作系统下部署;支持基于国产化软件、硬件的私有云平台纳管。聚焦底层核心纳管能力。 【A4】 国产化是趋势,国内私有云平台发展的速度也比国外走的快,从政策要求、产品水土适应和产品售后服务等综合角度,也推荐国产化的云管平台。
【A5】 目前国产化主要是在党政机关部门开展。生态正在逐步完善。
【A6】 国产化是趋势。也是国家战略。现在国产化产品欠缺的是良好的生态环境。如果大家都能开始逐渐接受。国产化产品的进步应该会更快。这个必然是需要一定的时间的。我觉得提前考虑国产化产品是很有必要的。条件允许的情况下。可以逐渐从一些外围业务开始接触国产化的产品。

【Q4】云管平台建议自研还是外购?云管平台主管部门由运维部门负责还是架构部门负责?
【A1】 是否自研建议根据自身情况来定,自研的优势在于能够更好的适应需求,功能能够及时调整;劣势在于对自身的设计、技术能要求较高。选择成熟产品能规避上述劣势,但是个性化需求调整方面可能受产品的架构或费用等方面限制,部分难以实现或实现时间较长。 云管平台建设3分技术、7分业务,能否准备把握使用者的需求,让使用者用的好,是云管平台项目能够成功的关键,建议让能够统筹全行it需求的架构或者类似部门牵头。 【A2】 这个问题我觉得要看以下几个方面: 1.从成本上考虑:采购成熟软件,远比自研成本低;2.从功能上考虑:自研软件功能灵活度高;3.从运维上考虑:自研软件运维成本高;4.从公司性质上考虑:传统企业建议采购,技术型企业可以自研。
【A3】 私有云通常有两种建设方式:一种为公有云私有化部署,阿里专有云即属于这种;另外一种即通过OpenStack构建。由于OpenStack的投入成本相对较低,相对公有云来说,OpenStack更加灵活,易于定制,更适合依据企业特点量身打造个性化云平台。对于公有云私有化部署方式,公有云厂商已经提供了一套完整的云管理平台,用户可以开箱即用或者做少量的定制开发即可满足需求。而通过OpenStack进行构建的私有云,就需要用户自行考虑如何构建或者购买第三方的专业云管产品。
【A4】 从应用较多觉得主管部门应该为架构部门负责选 ,从后期维护交付来说是公司运维运营部门进行端到端的最终交付。
【A5】看您属于什么行业?互联网行业多数是自研为主很少为成熟产品买单。一般企业建议选择成熟产品,自研时间和人力成本太高。云管平台涉及到架构,多数是以架构主导,后期转运维。


# 关于云管平台架构设计问题
【Q5】作为软硬件资源服务化、抽象化的云管平台,其逻辑架构如何清晰化地设计和界定?
【A1】云管平台的设计,可以以所提供的服务、组件为维度设计,比如数据库(mysql,postgres,mongodb),中间件(rabbitmq,kaffa),实例(服务器、网卡、安全组....)
为实现 IT 服务管理模式转型,需要 2 部分工作 : 一部分为基础架构层建设,需要建设可编程的基础设施,软件定义基础设施,即提供 API 可通过调用 API 提供资源,如 VMware 和 PowerVM 虚拟化平台、私有云、容器云、 SDN 、软件定义存储等;另一部分为服务化工作,即需要在基础设施之上建设云管理平台, 在软件定义基础架构平台基础上建立面向业务开发测试、应用运维的 在线 服务门户,与流程管理系统对接,使开发测试、应用运维可在线申请,审批通过后,平台自动调用软件定义基础架构 API 以及运维管理工具 API 完成应用运行环境自动化交付和管理信息的自动同步 。实现基于安全合规强监管要求下的资源环境的在线自助服务、自动化部署以及部署后的变更、回收全生命周期管理。

通过上面的建设 , 可以解决以上矛盾和问题,一方面更加快速可靠的提供开发测试、生产运行环境,解放生产力,助力加速开发测试、投产上线、业务发展;同时, 释放 IT 人力,实现资源的全生命周期闭环管理,持续跟踪精益管理 ,减少资源浪费 。
【A2】先上图:

狭义的云管平台就是在云资源的上层,再做一层管理平台, 即资源服务层,来实现自服务界面,将服务的底层资源实现、部署策略和动态调配实现抽象化,并集成各类运维、管理和流程的工具等。而广义的云管平台则另外包含了云资源管理平台,要形成资源统一适配器接口,来匹配底层不同的计算、网络和存储资源,实现对所有异构的资源的统一管理,这样的好处在于通过统一的资源适配接口屏蔽各位资源的差异性,同时支撑上层的服务编排与部署。所以,我们更应该以广义的角度去设计和界定云管平台,而不是狭义的将云管平台和底层各类资源去简单适配和驱动,一方面这样做,容易将资源服务层越做越臃肿,而且还很难解耦合。另一方面,这样做的整体架构不清晰,资源变更和新增后,又会加重资源服务层的开发难度。
【A3】 独立云管平台应该具备以下几个产品要素 :(1)云管平台应该可以独立分发和部署 平台可以依赖其他(例如IaaS平台)的部分组件,但是云管平台自身应该可以独立分发 。(2)云管平台应该完全通过开放API与外部系统交互 ( 底层IaaS/PaaS平台,还是用户系统、CMDB 或者用户应用)。(3)应该具备云服务形态的抽象能云服务的平台。不同的云管平台在具体管理的云服务类型区别。但作为一个独立云管平台,对于需要纳入的云服务形态,都需要具备跨云服务供应商的抽象能力。例如,如果需要重点管理云主机,独立云管平台需要能够抽象来自虚拟化环境、公有云和私有云的云主机服务,并提供统一的服务目录、交付等。(4)资源池的集群化管理,集群划分原则灵活可配,并通过区域划分的理念实现不同级别平台的部署 。

【Q6】银行两地三中心容灾模式下,对于异构私有云统一管理,云管平台部署架构设计应该如何设计?
【A1】 这个是好问题,现在有很多公司设置灾备环境,比如一个在腾讯云,一个在阿里云,如果要设计统一的云管平台首要的就会 “配置中心”,因为每个云上的Paas都是不一样的,需要将配置统一放在云管平台上,才能实现自动切换,竟可能减少切换的时间,也方便更改配置和配置审计。
【A2】 在多数据中心时,要实现多数据中心资源服务的统一调度、编排和管理,就必须要一套云管,实现多云管理,每个数据中心又都可能存在多种异构的小云(VMWARE X86云、POWER云、KVM X86云、HyperV X86云等等),单数据中心可以通过云资源适配平台对这些小云进行统一适配和接管,统一云管再分别对接这些云资源适配平台。这样就能顺利实现多云管理,通过云仓库来保证多云间模板、镜像、配置等的一致性,更有利于多云下标准化的落地和实现。同时,更为便利的是,能够实现多数据中心云的统一编排了,按照精心指定的编排模板,能够轻易实现多数据中心资源申请和部署。
【A3】 好问题,也是很多企业都在探索和考虑的方向。长期混合云的趋势已经确定,留给IT管理者的更多的是考虑如何统一管理。我们目前处于尝试阶段,所以不敢班门弄斧,但是有些经验和坑可以分享给你:1.云服务商之间竞争激烈,很少有那个供应商可以同时兼容多家公有云; 2.容灾模式要考虑平台的平滑切换问题,比如PAAS接口问题;3.云平台架构的差异性。
【A4】(1)可以跨多个虚 拟 化管理程序、私有云和公有云交付基 础 架构和 应 用,同 时 保持速度和控制力。(2)自助式门户使授权管理员、开发人员或业务用户可以基于组、角色或策略控制他们请求基础架构、多层应用或自定义服务的方式。(3)基于蓝本的基础架构和应用服务交付可简化私有云和公有云环境中多层应用和其他自定义服务拓扑的交付。(4)基于策略的管理控制用户可以请求的服务、他们可以使用的资源的量或类型,以及他们可以跨服务或工作负载生命周期执行的操作。(5)智能化资源管理可确保根据业务和服务级别要求分配资源,并且可以适当调整资源的规模以优化容量利用率。

【Q7】云管平台架构选型分析及引入策略如何考虑?云管平台架构是选择商用还是开源架构?开源架构主要是基于openstack开源技术为代表,传统厂商:华为,fit2cloud,浪潮,华三,vmware等等。案例来说都有不少,那应该企业应该如何选择呢?都说适合最重要,但是这个适合其实是最不好把握的东西。引入的策略应该如何考虑?听听有经验的朋友,你们在寻找适合的架构的时候,是经过哪些比较分析的?
【A】 主流商用和开源架构其实都是基于OPENSTACK技术的,无非是在开源基础上,封装了商用的技术而已。用纯开源来做会有很多问题,其实主要问题还是在于到底是自研还是商用产品,自研成本高周期长,见效慢,个人认为采用商用成熟产品是较好的选择。一般首先要理清楚自己现有架构和需求,只有对自己的需求充分分析清楚后,才能对今后的选择有清晰的判断。其次再对各云管平台厂商的产品进行深入了解,主要考察他们的案例,尤其是在您企业当前行业的案例,最好能去案例实现的企业去现场考察。有了以上的调研经验后,接下来可以选择前期调研后,觉得符合要求的2-3家来做POC,说得多不如比一比,真刀真枪过后,方能知道哪个是真正的好产品。另外,除了产品本身架构和质量外,还要考虑 厂商的技术潜质和发展,倘若现阶段来看产品是好,但厂商本身技术能力不太够,产品的更新迭代能力较弱的话,难免用到后面又推翻重来。

【Q8】云管平台与云架构建设过程中应注意哪些方面?我们正在规划建设云架构,为兼顾原有的VM环境,也准备同步上云管平台,在云架构和云管平台建设过程中应当注意哪些方面?
【A】 1、要注意云管架构分层,剥离出一层来做统一资源适配层,作为技术实现层。上层云管作为服务抽象层,将技术实现抽象为资源服务。2、要注意底层资源信息往上层同步的问题,原有资源信息,包括原有的VM环境,同步至技术实现层和云管平台层。3、要注意服务编排引擎的选择,异构云管要能做到跨云编排能力。另外服务编排的可视化也是很重要的,通过托拉拽搭积木的方式编排服务模板。4、要注意云管和其他运维系统的边界问题,哪些云管来做,哪些通过对接的方式集成。

【Q9】城商行如何推进私有云建设(从技术架构选择)?1、云计算 如何技术架构设计;2、出发点 传统生产架构改造上云 如何建设?是否有必要?;行内现在战略规划推动互联网金融发展,如何匹配建设云;3、当前应该是 传统与互金一起上, 还是只是单独针对互金业务推动云建设。如何推进硬件资源IAAS 层建设 选型, 如何过渡到 平台层 PAAS层建设, 最后如何进入容器云阶段; 4、欢迎 各位大侠 指点迷津!!!(我行的传统架构已十分健壮了)
【A1】 先说第二个问题吧。传统生产架构改造上云是否有必要。我觉得这个是首要问题。要根据现有的架构评估上云的必要性。虚拟化是否能解决问题,上云并不一定是企业的一定选择。这个要根据业务量。业务特点等等决定的。如果企业的发展规模庞大。系统变得越来越复杂。并且业务更新上线也频繁。那么则卡可以考虑改造私有云。私有云的选择。总体上我觉得无外乎两种。技术实例强的选择开源,自研。否则。则直接选用成型的商业产品。业务上线上。我还是主张整体考虑。分布建设。逐步迁移。避免一次性的动作引发多方面问题而无法判断。
【A2】 1、云计算大体架构为资源池---虚拟化管理平台---云资源适配平台(IAAS)---云管平台(服务、编排、管理、安全、运维等等)。2、就如您所说你们行传统架构已经十分健壮了,我个人不建议为了上云而上云,但要有云,可以把云架构做出来,无论是互金业务也好还是其他传统业务也好,新业务或者老业务改造后的资源都可以上到云上面来,这样稳步推进,传统架构也没发生根本性变化,新架构也用得蒸蒸日上。这是通用的方法。3、项目一期肯定是IAAS云,这是毋庸质疑,后面再把云管做出来,统一异构资源管控也是流行趋势,接着开始大力推进服务目录和编排,把你们常用的资源服务编排成模板或者目录,从IAAS过渡到PAAS云,当然云容器一旦用起来,就直接是PAAS了,再和云管平台进行对接。这是我的思路供您参考。
【A3】(1)云架构的设计: 内部业务上私有云,互联网业务可以考虑公有云;目前Kubernetes方心未艾,所以,以openstack架构(只是架构,具体找供应商,不是用开源)+ K8S + 传统架构整合为主,至于其他几位提出的云管平台,只是一个UI的统一界面,forget it,你的供应商会提供的。(2)如何构建: 首先,你要了解,云是什么,云是种服务模式; 也就是说,如果你的行内,如果都是传统架构,我可以用一个openstack来整理管理你的传统架构,然后,对外提供服务,那就是传统架构就瞬间变为了“云”。这个在paypal公司(美国的支付宝)就是这样。 而且,我可以告知你,德国大众也是这样的。要知道公司过去已经有大量的传统架构了,有vmware、critx等等,难道全废了,上新的云再建起来,no,no,no,千万不要这样做,成本太高,你要做的是整合。云有整合的功能。(3)传统和互金并不矛盾, 对应于传统,你仍然可以通过传统模式建设,只要和云供应商谈好接口即可,到时候,对接就可以的。 一定要记住,“云化”是种整合,你现在所有的设备都可以云化。当整合完毕后,你的IAAS就完成了,接下来,你传统组件可以有什么功能,可以提供相应的api接口,在云平台上提供出去,这就是Paas了。(4)容器云,是需要改你底层的东西的,你可以在新的项目上,采用容器云的方案,老的就不要动了,采用整合的办法整合到云平台中,最终,通过一个统一的UI界面对外提供服务,这就是你们的企业云了。
【A4】 1、IAAS、PAAS都是为了快速交付相应资源而生,IAAS快速交付计算资源、PAAS快速交付应用资源快速部署上线。当前行里现状是否有这些需要,这块儿的工作是否已经有了瓶颈?IAAS层与PAAS层架构上考虑的问题有很多区别,IAAS需要考虑机房机器的部署、网络的情况,银行受监管的要求比较多,网络分区是个比较大的问题。PAAS层需要考虑应用的改造,应用的架构与当前行方的网络架构是否有冲突,应用的部署是否受相应制约需要提前考虑。2、考虑清楚第一点,那是否要上云心里应该有个初步考虑。如果当前运维的能力已经无法快速支撑业务的发展,那上IAAS,上云管是一个比较好的选择。若当前应用的迭代速度非常快,且有的时候会出现失控的情况如应用上线出现问题但无法快速回滚,部分业务系统的问题导致大面积应用无法正常服务等等,那就考虑PAAS层的建设。当前一直吹捧的DevOps概念还是有道理有价值的。3、互金业务在前面试水吧,传统业务的改造有很多制约,存量系统谁来改造匹配当前架构?系统稳定运行多年,根据行方的业务发展,能满足近几年或者几十年的要求,那改造的意义何在?微服务架构固然有他的意义在,但通过其不断的发展,带来的很多问题显而易见。
【A5】 1、如果已经有vmware了,可以采用独立商业云管+商业PAAS。2、云管平台可以纳管已有虚拟化资源,一般也对接了主流公有云。3、paas平台可以选商业开源,比如openshift或者Rancher。云管平台可以初步对接paas,达到形式上的统一云平台。4、传统业务改造也是一个逐步的过程,所以单体传统应用和微服务互金业务三年内至少也是并存的,就是算是互金业务,现在数据库一般也不上容器。5、云管作为统一入口,可以对接ITIL,堡垒机等周边运维子系统。所以用云管统一IAAS(vmware)+Paas就好。
【A6】1、首先上云是趋势,是必然之势。未来将是传统企业大规模拥抱云的时代(私有云、公有云)。可以将重型应用转移到云内,实现按需供给,节约成本;2、传统企业逐渐拥抱+互联网概念,通过互联网提升自身业务能力、生产能力等,而这些的基础就是云、大数据、人工智能等技术的结合; 3、其实不必要过快的通IAAS过度到PAAS,要根据企业的实际情况而定。传统企业的属性始终是稳定为主,尤其是银行。


# 关于云管平台功能性问题
【Q10】金融行业云建设一期云计算平台的通用功能需求点,欢迎提供专业建议?公司计划按照信息安全等保三级要求建立金融行业云(主备机房模式,自用+对金融客户租赁),目前跟多家云厂商做了沟通,各家云计算平台功能匹配的技术不一,我司一期建设计划是IAAS层+SAAS,先把主要的架子搭起来。现在要写一份各家基本匹配的功能需求清单用于招标,烦请各位专家提出建议或提供成型的技术需求文档方案或招标文件提供给我参考。万分感谢。
【A1】建议谈不上,过去有个失败的例子,供参考。上家公司名字不说了,说出来大家都知道。要建立一个宏大的私有云计划,计划投资10.8亿美元,规划了一个数据中心,8个模块,计划采购上万台服务器,招了600多名技术人员,联系了ibm、easystack、青云等各大商业云供应商,不断谈判,历时一年,结果到头来,项目取消,技术人员全部解聘。我建议以下几点:(1)成本: 最主要的,私有云、公有云,初期投入巨大,特别是金融云,要求两地三中心,所以,初期规模不应太大,应分多期进行。造一期,产生效益了,再造下一期。(2)供应商: 建议使用成熟的供应商,底层基本都是openstack,但是openstack是半成品,各个供应商有各自的高可用一站式解决方案。(3)技术人员; 初期以管理人员为主,降低成本,产生效益后,纳入技术人员,开始接管供应商的技术。(4)网络: 云数据中心,重在网络,机房建设,初期必须网络先行,要仔细规划,考虑二期、三期的需求;(5)服务器: 一期建议高配20%,中配40%,低配40%,初期高端客户较少,用中低配打开市场,如果是公有云的话。(6)存储:建议使用存储集群。 (7)备份:使用统一的备份中心平台 。(8)外网:这要和三大供应商协商,至少是BGP线路,如果是公有云的话,带宽在1~2G,私有云可以降低。
【A2】 看您这边设计,是混合云架构,建议引入独立的云管厂商。这种独立云厂商一般都与国内外主流公有云、openstack、openshift等完成对接,这种对接一般是松耦合对接,混合云架构的基本功能都有,扩展模块也很容易增加和减少功能模块。这种模式适合分级投入,如果不做大量定制化开发,后续换云管厂商的代价也不大。仅供参考。

【Q11】云管平台的解决企业的哪些问题,是否达到了真实效果?1.云管平台是否主要是为了解决你企业哪些具体的问题 2.众多的产品应该如何选择 3.选择了产品是否达到了你相应的效果 4.有哪些真实的经验可以分享
【A1】 (1)云管平台有好多种,有些只是管理云上的资源,有的加入了DevOps的成分。但无论何种,目的就是把企业的it流程标准化、客户化、自动化;(2)很多的产品,你只要根据你选用的什么云去选择,比如你用azure云,当然不会去用阿里的云效,但如果是私有云的话,如果是自己搭建的,那就是openstack自搭的了,你就需要考虑github上那些开源的云管平台了,如果是买的工业商的,那又绕回来了,供应商有。比如ibm有叫bluebox,如果我没记错的话。(3)产品的评价,要根据你的需求,如果你没有跨云的需求,那基本上每家供应商的云管平台都可以满足你的一般需求。如果你有DevOps需求,基本上现在每个vendor都在做自己的DevOps云管平台。(4) dell emc的云管平台给我们介绍过,是私有云部署,买vmware vcentor,居然实施供应商是Dell,还送云管平台,十分超值。
【A2】 1、主要是为了解决大运算需求的业务支撑,提供弹性算力、按需提供计算、网络、存储的能力;2、根据企业的IT能力而定,比如技术型公司可以考虑开源云平台,传统企业建议采用成熟的软件产品;3、目前我们使用vmware和openstack两种平台,vmware用于生产,openstack用于测试和轻业务;4、可以参考我之前发表的文章(在TWT中)
【A3】 1、统一纳管多云环境,屏蔽异构云给运维人员带来的复杂度。快速交付计算资源给到应用开发人员使用。2、市面上的产品大致都差不多,找个调研下来产品比较稳定,在同行业中有类似案例落地的厂商吧,最好该厂商能满足一些定制化要求比较好。3、效果肯定是有的,主要的功能市面上都是类似的。针对自己特殊的场景做一些定制化改造,很多问题可以得到解决。4、不要大而全,先着重解决当前痛点,锦上添花华而不实的晚点再说。
【A4】 1、云管平台最主要解决的还是业务敏捷发展带来日益增长的资源需求与传统资源管理的自动化、敏捷化低下的矛盾问题,同时解决各分散资源管理上的不便捷和不统一,资源标准化难以落地的痛点。2、云管的产品确实够多,国内外的。但如果真正去仔细去了解的话,能够实实在在匹配企业真实需求的,可以直接筛选掉很多,很多云管实际都可能功能溢出了。3、我们在选择云管时,最主要关注的是服务编排引擎的能力和云管二次开发的能力,其他花里胡哨的功能能不要就不要,这样尽量清晰化云管平台和其他运维平台的边界。


关于云管平台监控方案问题

【Q12】云管理平台如何针对idc的监控解决方案有哪些?基于哪些技术实现?有没有比较靠谱的供应商?
(1)云管理平台一般都具有监控功能,但是没有专门的监控平台监控指标颗粒度那么细,比如服务器和网络设备的硬件监控等。可以集成zabbixj监控平台实现更细致的监控。 (2)云管理平台最重要的实现iaas和Paas功能,且对后期的迭代优化要有很好的技术支持和平台变化的灵活度,能够根据客户的要求进行灵活定制。可以对fit2cloud这个产品进行了解。

【Q13】云管平台需要统一监控平台吗?背景:目前企业已经有类似BMC这这中传统的监控和告警平台,但是企业容器平台自带promethus监控,云管平台本身也会从VMWARE等不同云平台收集监控和告警信息。
【A1】(1)云管平台和传统的设备,不是两套,不要划清界面。 所谓的云的概念,一定要端正,云是种服务,不是任何设备的代名词。所以,你BMC监控,你告诉我,为什么不能集成对云的监控。(2)传统的企业,不可能完全新建,必须是借助云来整合老的设备,然后新的项目上Kubernetes,上容器云。 vmware + Kubernetes + critix + 裸机(物理机) 可以整合成一个大的企业私有云。 而这个私有云,需要有一个统一的监控中心。然后搞一个统一的监控大盘(APM) 如果,现在你的BMC不支持,你可以去询问你的bmc的vendor,是否支持对prometheus的整合,是否可以访问prometheus的api接口,这并不是很难的。
【A2】最好运维的头等大事可以说是监控了,没有监控犹如人无双眼,那是不是说有监控就能万事大吉了呢,显示不是。大量的无效告警,重复告警,如果不能很好的设置规则,那么监控给你带来的烦恼也是问题诸多,反而会拖累整体运维工作。不管哪家的云管平台产品均是有所监控的,但是这个监控范围和整体可控性,应该来说没有统一的监控产品兼顾的那么周全,否则就要在云管平台上做大量的二开,工作量和投入也不小。为了有利于整体的运维和后期的持续性,应该结合企业自身的具体需求,维护好一个开源或者商业产品监控解决方案,作为监控的统一入口,不断的更新迭代,一段时期下来企业就会积累很多经验,后期的运维也会更加的自如。
【A3】 系统越来越复杂后。维护就变得更加重要。而对于所有业务的监控也就成了平时运维人员了解系统状况的一个主要窗口。所以当系统变得越来越重要和庞大时。监控平台也应该建设的足够智能和强大。
【A4】 需要一个统一的监控平台实现告警事件的集中管控、丰富、翻译、告警、分发等等。否则每个告警平台各自为政,推送的消息格式不统一、CMDB基准不一致,造成告警误判。而且也不利于事件的统计、分析,也不利于今后运维智能化方向的演进。
【A5】 监控平台是需要的,这样能对 企业容器平台 、云管平台 及其它的平台进行统一的监控,这样才能降低企业运维人员工作的复杂度。
【A6】 肯定是需要的。从IT运维一体化方面考虑,需要将其纳入公司的ITOM平台,实现统一管理、告警、处理。
【A7】 这还是有必要的,随着系统数量的增加,运维难度会越来越高。统一的规范,统一的标准对运维来说会轻松很多。现在对运维的要求基本都是有时效性要求的,快速定位、快速处理。
【A8】 还是需要的 在日后做根因分析 没有一个统一平台 是无法完成的。


关于云管平台边界划分问题

【Q14】云管平台作为IT基础架构下资源的全生命周期管理平台,如何更清晰地与其他运维系统的划分功能边界?
【A1】 云管平台,主要负责云上所有应用生态的使用,但并不负责生态中所属组件的运维,比如数据库(mariadb),只负责用户如何申请、使用、反馈,但如果该组件出现何种故障,则要具体组件的运维人员负责。
【A2】 我们先来看一下Gartner 对 CMP 的定义---CMP (Cloud ,Management Platforms,云管理平台)是一种管理公有云、私有云和混合云环境的整合性产品,其最小的功能范围应该包括自服务界面(self-service interfaces)、创建系统镜像(provision system images)、监控和账单(metering and billing),以及基于策略的一定程度的负载优化(workload optimization)等。高级的功能还包括整合外部已有的企业管理系统,包括服务目录(service catalogs)、存储和网络资源配置,更高级的资源管理和监控,比如客户机性能和可用性监控等。 由上面的定义我们可见,云管实际上是一种资源服务的全生命周期管理平台,重点在于“资源服务”,引擎在于“服务编排”,围绕这个重点我们去设计云管平台时,才会不会将重心偏移暨定目标,那些外部系统更在行的比如“流程”,“监控”,“4A(认证、审计、账号、授权)”,“CMDB”,“通知系统”,我们只要进行对接集成或者整合即可。不需要将云管平台的主要功能放到这些外部系统更在行的功能上,这样容易造成功能边界不清,重复建设,互相矛盾的后果。而应该将主要精力放到,资源管控、资源服务化、服务目录化、编排模板化、编排可视化等方面。

【Q15】云管平台和ITSM平台的功能边界如何划分?在流程跟进和变更实施的过程中,哪些应该在云管平台实现,哪些在ITSM实现,这样划分边界有什么好处?
【A1】 云管和ITSM建议分开建设,可以把审批流放到ITSM里面。云管只负责资源服务的申请流程,涉及部门和领导的审批放到ITSM里面,云管最好不要替代ITSM的功能,对接为好。
【A2】 云管和ITSM是完全两套不同的东西,个人认为,云管专注于资源全生命周期服务,ITSM专注于运维和流程服务,方向不一样,所以它两的关系是对接的关系,ITSM来做流程发起审核,云管来做资源服务的落地。而不应该把该属于ITSM的东西,又要剥离一部分资源的流程去云管。我们只要做好这两个平台的对接就好。

【Q16】云管平台与运维平台的是应该统一建立还是分开建立好?如果分开建边界如何划分?在企业没有成熟的云管平台和运维平台的情况下,企业应该分别建设云管平台和运维平台 ,然后对接(方案一)?还是选择一个云管平台,然后丰富其运维功能(方案二)? 方案一的困难在于需要分别建设,需要划分边界;方案二的问题在于云管平台会越来越臃肿,演进方向不明。
【A1】这两个,没有必然的联系,如果你要合在一起,那才是臃肿和牵强的。别的文字解释太苍白繁琐,我给你栗子, 最明显的你看公有云, 拿阿里云来讲,它的云管平台,就是 它的console,你可以在上面申请虚拟机、申请数据库等等各种Iaas和Paas的服务, 这些都是基础运维的范畴。同时,阿里又提供的云效平台,它的作用是提供了从项目管理、CICD、测试、部署一整套DevOps流程,你可以看做是运维平台。是关系你的应用运维的范畴。所以,通过这两个平台,以你的基础运维(主机、数据库、网络)和应用运维明显的区别,把两个平台完全分开。
【A2】 首先要看企业应用的规模是否必要上云管平台和运维平台,现在好多技术高大上。但对于企业来说。并不是所有的企业都需要。有时候可以采用很多折中的其他手段来代替。 另外这两个平台的功能也是独立的。所以建设上还是要分开的。
【A3】 云管平台的运维是整体运维体系的一部分,应该是统一考虑,建议别独立考虑。应用统一的运维标准,只是在管理制度上有所区别。(个性化的一些设置)
【A4】 分开搭建是架构确定的 但云平台交付的 信息 要统一到运维平台 , 是用同一个cmdb 完成数据统一 。
【A5】 云管专门干云管的事,运维平台专门干运维的事,边界完全要区分清楚,混在一起,结果都双方受限,这是我的观点。
【A6】 这个就要看企业实力了,企业小那就需要一个人干多个事情。企业比较大,可以将部门划分比较细,各司其职。

【Q17】云管平台的运维管理应该具备哪些功能才算是完整?请问老师,云管平台的运维管理应该具有哪些功能才是完整的?谢谢
【A】 首先要明确的是云管理平台集成的功能全,灵活。那么在做的时候就要有侧重点,比如一个专门对接openstack的云管平台,在集成power,vcenter等的时候就要对一些特有功能做裁剪,管理界面主要遵循openstack的功能设计。


关于云管平台对Power小型机的纳管问题

【Q18】多云管理平台下传统HMC配置的PowerVM选择哪种管理模式比较好?传统小机部署的应用如何现代化,选择作为物理机管理是否比较合适。因为不具备任何PowerVC管理特性。
【A1】powervc是可以管理hmc的,本身是可以管理powervm,kvm on power,powervc本身就是一个高级虚拟化管理平台,向上可以集成到高级云平台,cloud powervc manager,可以和浪潮云海OS .华盛、东软等高级云管平台结合的。
【A2】物理小机也就是没有做POWERVM虚拟化的小型机没办法纳入POWERVC管理,一般是通过OPENSTACK裸金属组件来对接物理机设备,需要一定的开发量。没有POWERVM通过POWERVC,再集成到上层云管那么直接方便。

【Q19】金融业云管平台纳管IBM小型机的案例多么?一般的云管平台都能纳管x86服务器,针对存储,小型机等设备纳管的案例多么。
【A1】这个在银行案例比较多,一般是采用ibm的powervc进行管理,powervc可以和openstack进行结合,上面可以接多种云管理平台管理 。
【A2】IBM小型机和存储用POWERVC纳管,这是最成熟的POWERVM纳管方案,POWERVC本身也是基于OPENSTACK架构的POWER IAAS层云管,一般为了做到异构云管,将POWERVC的ADAPTER DRIVER集成到更上一层云管中,来做统一管理和编排。

**【Q20】当前传统行业(POWER+X86),多环境下DevOps如何规划,现在业务如何调整?
公司现有环境:A:X86 KVM环境多套 。B:VMWARE 6.5 环境一套 。C:AIX POWERVM环境,E870,E880生产环境。D:华为云正在实施 。E:核心的应用以关系型数据库为主
F:少量的开发、测试。问题:多环境多平台 如果考虑DevOpes的话,如果切入,如何规划一套可用的,可行的开发和运维,如何规划?**
【A1】(1)注意到有vmware和kvm环境,建议构建 infrastructure as code, vmare有自己的虚机构建软件(boss),请参考有关资料;(2) 注意到有华为云,建议 infrastructure as code,以terraform为基础,阿里腾讯都支持,华为应该不会落后;(3)源码放置在统计的自建的gitlab或github上,建议不要放置在云上。(4)多环境下,如果有甲方统一管理,CICD建议一套 jenkins + ansible(容器环境建议Spinnaker) 如果由乙方分别管理,CICD建议多套jenkins+ansible(容器环境建议Spinnaker)隔离。(5)中间加入checkmarx(安全)和sonarqube(代码质量)检测。(6)测试加入roboframework,自动化测试。(7)必要的,再加入harbor镜像库、nexus私库等仓库。
【A2】(1)devops解决的问题是开发的快速迭代、标准化、持续化、快速发布。对于贵公司的现状来说,核心的应用使用power+关系型数据库,业务的迭代要求肯定没有高,建议最后考虑使用devops。对于VMware和KVM+X86可以考虑纳入华为云进行统一管理,powervm如果业务需求变化不大的化建议不用管理,毕竟属于核心系统,稳定可靠最为重要。 (2)希望你明确自己搭建devops的目的是什么,开发测试的体量有多大,迭代需求频率高不高,但是从你的描述看开发和测试并不多,建议根据业务的需求进行使用devops。
【A3】可以考虑部署PowerVC,但是并不是为了解决Devops。
【A4】POWERVC经过我们实际使用,只能和V7000,SVC中底端存储配合使用,跟DS8000高端存储使用远不能满足生产需要。
【A5】楼上回答的很彻底,另外这个环境下也可以考虑引入powervc平台进行云管理。


云管平台其他问题

【Q21】虚拟化维保的重点、难点是什么?1、虚拟机故障或者虚拟机CPU内存占用过高怎么解决? 2、虚拟机删除、新增注意事项是什么? 3、虚拟机新增后通过什么样的方式同步到备用系统?
【A】 1、虚拟机故障要看什么类型的故障,如果只是CPU和内存过高,需要进入操作系统中,分析什么进程导致CPU和内存过高,是线程死循环还是内存存在泄漏问题,具体问题具体分析。如果只是正常业务所需,业务并发带来的CPU和内存高,那利用虚拟化资源池扩容的便捷性,在线扩容即可。2、虚拟机删除前先停机,不要直接删除,或者用虚拟化的快照功能,做份全量克隆。新增虚拟机注意当前计算节点的CPU和内存使用率,如果该计算节点已经使用率非常高了,那要换一个计算节点去分配。3、这个问题没看明白,我想您所说的应该是虚拟机如何备份吧,现在虚拟机的备份技术已经很成熟了,一般是通过快照的方式,同步到另一个备份存储中。

【Q22】企业云平台建设中普遍缺失云管理平台,这种情况下会面临哪些问题?云平台建设的基本目标包括满足应用研发及运维需求,能够按需快速弹性提供资源并能支撑和满足业务应用运行和维护管理需求,大幅提升交付速度效率和降低成本;另一方面,能够满足上云之后IT部门对新增云资源的管控治理需求。然而由于企业云平台建设中普遍缺失云管理平台,这种情况下缺失云管平台会带来哪些问题?后续应该如何进行改进?
【A】 缺失云管,各朵小云各自为政,缺乏统一的资源全生命周期管控中心和容量管理中心,资源无法晋升为资源服务,也没有资源编排,各运维系统没有统一的云管对接平台,容易造成监控、CMDB、流程都较为凌乱,同时也很难推进运维标准化和自动化落地。

【Q23】私有云IPV4向IPV6过渡的解决方案?自私有云向云平台的跨越,是否有考虑到IPv6如何实现,或者私有云内部的IPv4改造如何进行?
【A1】目前IPV6是未来趋势,但还是得分步实施,先把公网地址逐步改成IPV6,再把公网业务的服务器、负载设备逐步改成IPV6,最后才会动内网业务。私有云内部IPV4地址改造牵涉的东西太多,肯定是放到最后实施的。
【A2】双栈技术:主机或路由器同时装有IPV4和IPV6两个协议栈,因此主机既能和IPV4通 信, 也能和IPV6通信和保证其发布等。隧道技术:在IPV6分组进入IPV4网络时,将IPV6分组封装成IPV4分组; 当 封装成IPV4分组 离开IPV4网络时,再装数据部分(IPV6部分)转发出去。

【Q24】如何改进与云技术特点适配的组织架构和内部流程? 内部流程包含:工单、流程、审批、成本归集、资金划拨。
【A】 其实,你要的就是一个云管平台。(1)云管平台中,平台管理员和底层运维分开,用户可以向平台管理员提出工单,平台管理员将工单发给底层运维人员。(2)所有平台的运维,只限于权限的划分,用户设立,有的客户化做的好的话,基本这些都是用户自己解决;那平台的运维只用来解决L1的运维,L2,L3全部转向底层的运维; (3)审批:由平台管理审批,同时还负责用户申请的安全审核工作; (4)成本: 云管平台有分账功能,对不同客户使用的账单,可以分别计费,并自动给出账单; (5)资金划拨: 这个好像是线下的了,一般不和财务系统打通。

【Q25】云管平台中如何使数据可迁移?如何使数据可迁移?随着应用程序分布在多个云平台中,混合云架构需要确保基础数据也可以在云管平台中流畅地移动,而不管其驻留在何处(本地私有云还是公有云)。如何确保数据存储机制和数据库的选择在数据的可迁移性方面可以发挥关键作用?
【A1】我一直对业务上云都保持着一定的芥蒂,或许是因为实体化的数据中心呆久了。所有的业务只有放在自己手里。并且可以自己去掌控将来业务架构的变更心里才踏实。上云的确有很多好处。但对于传统的制造企业上云也面临很多不可避免的问题,1.内部生产数据的网络传输与数据安全问题。2.传统制造行业在信息化上的投入紧张,而且不稳定。我难以保障能够每年都有足够的资金去去喂云业务。3.传统行业很多时候运维人员不足。业务分散繁杂。上云后对运维人员也是一种考验 。4.业务上云后便很难进行迁移,等于被绑架了一样。 所以我更倾向于自建私有云为主。公有云为辅。公有云只作为一部分灾备和数据容灾的功能。
【A2】 这是非常让人难以选择的问题。(1)我们之所以选择公有云,其中一是为了省钱,二是为了稳定。因为公有云背后有强大的运维团队,三原因有点丑,有人背锅。所以,Iaas、Paas我们使用的十分放心。(2)但是,一旦对公有云有了依赖,你强大的数据迁移就成了问题,就如果,原来有很多甲方使用了oracle的exadata一体机,但当昂贵的运维费用和对Oracle坐地收钱的不满,让他们想放弃时,却发现,他们根本无法承受迁移出来的,速度的下降,他们已经产生了依赖。(3)所以,我主张,即使在公有云上,也尽量不要使用公有云上的Paas,实在不行要使用,也一定要保证自身软件的普适性,也就是一切都靠api对接,独立于Paas平台,迁移到那里都可以。
【A3】 说实话跨平台的迁移还是很难的,CMP一般针对同平台的管理和迁移还是不错的。但是如果牵扯到混合云、不同架构的迁移,几乎就是不可能实现的,或者实现成本太高(自开发),不利于后期的运维。
【A4】 云管平台实现多个云平台的管理,实现资源的统一监控和统一管理,实现统一视图展示。本地私有云和公有云这本身的数据迁移就很难,首先实现数据迁移是要保障两个云管平台的网络都可达,本地私有云肯定使用的是内部网络,公有云肯定使用的公共网络,首先这个网络互通才能实现数据的互相传输,可想而知是比较难的,即使能通也很难保障在规定时间完成数据的传输。对于公有云和私有云的使用,就跟钱放在自己口袋和别人口袋的道理, 建议关键业务系统不要放到公有云上,如果涉及关键数据在云上的迁移到本地,建议定期通过备份和数据传输到本地进行保存。
【A5】 (1)镜像搬过去(使用V2V)。(2) 数据迁移(使用DBcongfig等方案进行数据迁移)。(3)使用热迁移将多云进行打通然后同步过渡数据 。
【A6】 这几乎是很难实现的,同平台下的异构私有云间的数据迁移倒是有办法,例如X86平台下的VMWARE和KVM间迁移,但若是X86云到POWER云,又或者私有云到公有云间数据迁移,技术上要克服的困难太大,用商用云管来做这种事情,几乎不可能。通常要做这种类型的迁移,都是应用自身基于不同云平台去做兼容性部署。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

13

添加新评论1 条评论

Hopper007Hopper007系统工程师, 富通云腾
2020-10-30 14:10
分析的非常好
Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广