2013年建设银行总行数据中心云计算管理平台正式上线,进行生产管理计算资源整合后,各个金融企业经过了4到5年的技术考察期和业务试用期,各个金融数据中心希望尽快部署云管理平台对已有的云平台进行资源的统一管理、计量和计费。已经规划和实施部署的云平台有也希望纳入未来建设的云管理平台中, 这种大型数据中心资源管理平台的规划和实施过程中需要考虑很多因素,包括网络连接、与已有虚拟化产品整合、平台自动化等方面。
1 机房管理员规划业务设备部署位置、分析电力负载和承重,不达标还需进行改造
2 设备入场并加电测试,正常则放入机房上架并加电
3 网络和存储光纤或者电缆根据需求布线
4 网络部门根据要求分配IP地址、防火墙策略和访问方式
5 系统管理员部署OS系统、数据库和中间件等通用平台软件
6 业务人员部署业务系统并测试
7 业务应用正式上线
整个部署过程多部门参与多人参与,业务流程复杂而冗长,部署时间多为两周以上。
1 机房管理员规划业务设备部署位置,分析电力负载和承重,不达标还需进行改造
2 设备入场并加电测试,正常则放入机房上架并加电
3 网络和存储光纤或者电缆根据需求布线
4 网络部门根据要求分配IP地址、防火墙策略和访问方式
5 建立各类虚拟资源池,包括服务器资源池、网络资源池和存储资源池
6 根据业务需求,新建虚拟机、安装操作系统并分配相关的ip地址,告知业务方
7 系统管理员部署数据库和中间件等通用平台软件
8 业务人员部署业务系统并测试
9 业务应用正式上线
以上步骤是数据中心业务应用上线的基本流程,在使用虚拟化云平台后业务流程变得更加冗长,但很多工作用户发现是前期规划不完善而导致的部署工作复杂业务流程冗余.
1.选定采购的虚拟化服务器型号,这里以x86为例
高配 48C 256G 4U 服务器
中配 24C 128G 2U 服务器
2.规范好机柜部署设备模板
3.规范的故障域(机柜)布线
4.设备完成硬件部署后虚拟化技术的部署
5.pxe完成部署后发送指令给云管理平台业务接口
获取相关信息后云管理平台调用指定虚拟化管理平台把该物理设备加入到虚拟化管理平台.列入到相关故障域中,整个故障域完成部署后,可进行业务部署
6.虚拟机自动化的ip分配设计
7.虚拟机的OS和中间件等非业务系统软件统一化管理
在根据自己业务完成上面硬件实施规划后实施流程变化为:
通过规范的故障域规划和业务上线自动化标准确立等一系列标准化推荐工作完成后,业务上线速度在一周之内完成(5个工作日).如果排除业务上线调试时间.虚拟机交付上线时间为1个工作日.从而大大提高基础架构的交付能力.
具体部署方法可参考下图:
在power设备上手动创建第一个vioc过程。
通过上面方法制作多个指定版本的模板包括 was, weblogic, rac, ha, db2等镜像方便后面进行基础平台供给使用.
配置powervc的各种组内容包括主机组,vios可配置数据量,并制规则等使部署出来的vioc符合生产环境需求.网络环境的部署目前多使用sea共享网卡进行.把物理网卡链接的交换机端口配置为trunk方式。使用mkvdev –sea entX –default entXX –defaulted 100,创建sea卡。
完成所有powervc的配置后,把powervc中的主机组同步到云管理平台数据库中,并通知业务开发部署人员在云管理平台申请vioc资源,云管理平台处理资源申请,并通过powervc的api接口对接powervc,调用创建接口完成vioc的创建(创建接口会传递vioc规格,链接组,存储组,存储模板,ip地址,网络信息等)通过存储的lunx复制完成aix以及其他软件的部署,最后交付给业务人员完成业务部署。
openstack目前部署生产环境需要12台服务器完成部署。
3个控制节点,3个计算节点(可扩展),6个存储节点(分布式存储),SDN网络设备需要单独硬件完成,软件sdn不建议上生产使用。
目前能对openstack进行金融生产级别运维开发的公司实力相对强的有华为和华三,其他企业的openstack的开发能力和软件维护能力相对薄弱。
与华为的openstack接口对接和集成是目前项目实施中经常遇到的事情。
华为openstack平台是开源版本上的高度制定版本,封装和优化了很多特殊功能来符合金融基本的技术性能指标要.
Openstack平台的一些基本技术不再这里讨论了,只说明下SDN的引入会造成什么样的运维影响.
Openstack设计就是为多租户的运营平台准备的,网络部署把网络区域进行了虚拟化规划.每个租户有一个网络区域(vpc)每个网络区域可创建多个子网,而子网通讯需要通过虚拟路由器进行(可有多个虚拟路由器),运维人员对这样复杂的网络设计非常难以理解而网络又是必须清晰明确的.所以在openstack实施过程中建议大家先详细学习下sdn网络部署方法和相关思路.方便部署设备时能清晰网络链接情况。对错误排查和网络访问申请能有清晰的意识。
Openstack的自身计算节点的增删等操作在管理页面有详细的操作方法无需特殊学习。
为了适应未来数据中心的运维运营模式.相关的基础平台技术维护人员也需要进行相应的角色转换.我们在项目实施中经常需要定义相关人员角色,包括:
虚拟化管理人员:
完成相关的虚拟化平台业务管理,包括powervm运维、vmware运维、openstack运维,而在这些技术人员中需要进行一些衍生工作,如各个系统的镜像封装以及版本管理,其中包括AIX、Linux、Windows 等OS版本镜像和OS+中间件版本镜像、自动化部署脚本维护,镜像内部通用脚本维护,从而提高单体人员的核心技术竞争能力和适应未来DevOps方式的运维管理模式;
基础平台运维人员:
从单一的基础技术运维方式转换为以业务自动化软件开发为基础的软件运维模式.
人员职能按技术运营分为:
轻度集成和重度集成对用户的需求:
大型金融数据中心对多虚拟化云平台进行集成,从而出现云管理平台。
而在云管理平台开发中会出现集成设计方向问题,高度统一化集成所有其他云平台所有功能适合有自主开发能力的运维团队,根据具体业务确定下面接口优先级进行云管理平台的功能开发和使用。
而无开发能力的运维团队建议购买成熟的产品进行云管理平台的建设,并进行简单的二次业务功能开发,挑选下面常用接口进行功能测试。
讨论下各个平台包括 vmware, powervc, openstack 这三个常用的云平台软件的集成方案.
为了业务快速上线金融数据中心目前的运维模式和业务模式情况下个人建议进行轻度业务功能集成.
集成的通用几个接口为:
这些附加功能可根据自己的业务情况进行选择.
资源的统一管理在云管理平台上应和底层云平台进行数据同步完成资源规划和分配.
管理员继续使用云平台来对计算资源做硬件容量配置和运维操作。
云管理平台为资源统一展示和资源分配平台。对已存在资源进行统一的资源展示和优化的资源分配。
在云管理平台开发中详细调研自身业务运作模式,按照制定模式开发各个组件接口,完成对各种虚拟化资源的调度。
云管理平台是金融数据中心在运营层面上最佳的统一资源管理实践.
对资源的统一分配,回收,规划等自动化的技术引入使数据中心技术运维人员大幅减少,运维人力成本会逐年下降.而业务上线速度反而比大规模人力运维减少数十倍时间.
这样统一的资源运维方式是未来保证企业在竞争中业务快速上线的必须手段.
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞11
添加新评论3 条评论
2018-09-02 22:00
2018-04-26 18:01
2018-04-26 16:04