平台人生
作者平台人生·2017-03-01 10:42
软件开发工程师·平台人生

云计算环境下的运维管理实践(下)

字数 1364阅读 4731评论 0赞 1

云环境下管理的关键领域实践

配置及资产管理

按照传统工作方式,企业A仍然采用手工统计的方式记录各类资源及资产的情况,通过EXCEL表格生成基本的资产清单,这种方式是在传统硬件管理模式下形成的,以记录资产的硬件属性和对应的业务用途为主,但在云计算环境下,由于资产的高度动态变化特征,导致资产清单更新非常不及时,与实际环境相差比较大,目前主要采用每半年清点的方式进行更新,费时费力,而且很多资产的属性因为资源问题也无法记录,需要的时候重新查验,事后也没有列入常规工作,基本属于一次性工作。主管领导也多次提出整改意见。
经过分析,该问题并不复杂,主要瓶颈在资产的信息采集上,只要采集到相关的各类数据,生成各类分析报表并不困难。而人工采集的成本是阻碍配置资产信息精细化的关键。
因此项目组在本次项目中引入了专业的配置采集工具收集云环境的计算资源信息,并对关键配置数据类型和属性作了如下要求。

如下是依据采集的数据生成的实时资产面板样例。

该类信息同时也可汇总到企业的CMDB中,为企业的总体配置管理提供输入数据。
在日常工作中,项目组建议形成资产定期汇报制度,以定期向管理层更新资产配置及变更情况汇报,并将其纳入到系统管理部门日常工作内容中。

安全及合规管理

企业A对安全非常重视,在企业内部采用了比较严格的安全管理制度,针对各类管理对象都有想关的安全管理规范,在网络层面也有比较严格的安全域划分和管理,但在分析过程中项目组发现这些安全管理元素都延续自传统环境的管理策略。对于云化环境的基础虚拟化部分没有设计针对性的策略规范,下图为采用厂商工具扫描后展示的安全合规情况。明显有较多的安全隐患,实际上不光企业A存在这种情况,大部分企业或单位在云的核心虚拟化环境上的安全管理上都相对滞后,没有针对虚拟化环境采用相关的安全管理工具,并配套相关管理规范。

常见风险项目举例如下:

很明显这些都是用户比较容易忽视的问题,也容易被利用,而且云化环境是个高度动态的环境,一次两次的检查工作并不能有效保持整个环境的持续合规,必须采用较高频度的检查才能减少风险,但用户面临的问题有两个:1.针对该环境检查那些关键项目;2.如何对大的环境进行高频度的检查,前者需要专业领域的知识和经验,后者是人工无法完成的,需要专业的工具支撑。
项目组在参考了厂商和国际标准后制定了针对企业A的安全合规策略。举例如下,以下为针对宿主机的安全检查策略:

为保证整个环境的持续合规,项目组和用户方制定了如下安全管理工作任务,将对环境的安全扫描定义为例行工作,并引入了专业的工具,分别针对不同管理对象进行不同周期的扫描检查,并配合检查结果构建了具体的工作流程,确保整体环境及时有效的封堵安全隐患。

小结

回顾整个项目来看,企业A遇到的问题其实在很多企业都存在,这主要是因为针对云计算环境,大部分用户都处于建设阶段,而对运维部分的改进主要集中在工作流程和工作模式上,但对云计算环境自身的新技术特性管控较少,管控深度也不够,一方面是缺乏足够的认识,还没有形成比较体系全面的技术管理经验和知识积累,另一方面是缺乏一些具有专业知识的专业工具的支持。而云计算本身的成功不是建设的成功,是运营的成功,因此后端运维环节是重中之重。企业在构建云计算的过程中不仅仅要关注Day1部署环节的建设,还应加强Day2运维环节的投入。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

作者其他文章

相关文章

相关问题

相关资料

X社区推广