wh85
作者wh852019-01-30 17:54
系统工程师, 某大型保险公司

企业自动化运维体系建设需关注的四个核心问题

字数 1944阅读 6517评论 2赞 3

近几年来,随着云计算、大数据、人工智能技术的高速发展,DevOps、AIOps等新文化、新理念的冲击,几乎所有企业的信息技术部门都在谋求变革,不仅仅是为了跟上技术潮流,更是为了能适应随着业务而一起发展的IT系统的运维复杂度和体量,有的走的比较靠前的企业信息部门甚至完成了从支撑业务到引领业务、技术输出的转型。在这场席卷全球企业的变革中,自动化运维体系建设就是非常重要且基础的一部分内容。

针对自动化运维平台,已经有许多技术专家撰文专门论述,其中大部分内容偏重于平台建设本身。而自动化运维体系则不仅仅包括自动化运维平台,还包括与之结合紧密的企业运维管理制度、运维专家的作用、运维流程的演进等内容,仅仅完成平台建设是不足以达到自动化运维的目标的。

本期活动针对企业自动化运维体系建设进行了讨论,涉及了变更平台、监控平台、CMDB、ITSM、管理制度、企业文化和未来发展方向等方面。核心问题包括以下几个方面:

如何建设符合企业实际的自动化变更平台?

嘉宾回复:
就笔者所在企业而言,直接的建设需求有如下方面:
A.同时满足系统自动化运维和应用自动化运维两部分内容;(笔者注:系统运维指操作系统、数据库、中间件等基础环境运维;应用运维指应用系统的部署和发布)
B.同时适应标准化和非标准化两类变更;
C.支持多个操作系统平台,包括LINUX\UNIX\WINDOWS;
D.可由运维专家灵活定制运维流程;
E.变更平台需要具备4A系统的特点,即集中认证(Authentication)管理、集中账号(Account)管理、集中权限(Authorization)管理和集中审计(Audit)管理。

非功能需求有如下方面:
A.高可用。不仅仅是自动化平台本身提供的服务需要高可用,其执行通道,即平台与生产服务器之间的命令通道也必须是高可用;
B.对外提供API或服务总线式的接口,以便更好地与其他运维系统,如CMDB相融合。

最终我们决定借助一些开源的组件,采用自研的方式去建设。具体的平台特点、建设思路可参看《自动化运维体系建设关键点分析——以某大型金融企业为例》的第2章。

IT流程和自动化变更动作如何结合?

嘉宾回复:
自动化变更并不意味着不需要审批。在DEVOPS成熟度模型里对变更管理人员和变更管理工具,定义了几个不同的成熟度。最高的5级是无人值守、4级远程值守自动变更、3级现场值守自动化变更。

许多企业现有的运维管控流程是是基于ITIL开发的,往往长时间不进行更新。在自动化运维普遍替代传统人工运维的背景下,一些管控流程实际上可以被优化。那么优化的指导原则又是什么呢?笔者认为,可以归纳为一句话:仅让需要审核的步骤被最适合审核的人审核,且不断根据实际优化或在可控范围内勇于试错。

例如,变更具体内容被平台固化了,其内容的审批实际上就应该前置到固化之前,而执行审批就可以将审批注意力集中在实施时间、关联变更上。再比如,一些常规的紧急变更,往往要经过层层审批,而这些审批动作几乎是清一色的“同意”,那么审批就没有存在的必要了,反而会在时间上阻碍变更的执行。自动化平台在数据上可以给审批者提供类似风险分级的参考,以便进行管控流程的优化。

从系统建设层面,流程管理平台实际可以和变更、监控平台将部分功能集成到一起。例如,可以将事务类步骤和运维步骤结合到一个复合流程中予以展现。下图是一个常规告警触发变更自愈的流程界面:
144m6pftsgm

144m6pftsgm

自动化运维体系各个要素之间如何进行联动?

嘉宾回复:
1、变更平台、监控平台、CMDB需要能提供API,满足调用和被调用两个要求。
2、CMDB建设需要确保数据的唯一性和真实性,且数据模型需要根据实际而更新。
3、变更平台要能和企业ITSM结合在一起。一同展现。
一个结合了审批流、自动变更、人工变更、监控信息的流程案例:
7swkzdvd2h3

7swkzdvd2h3

如何应对企业非标准化情况?

嘉宾回复:
方法1:改造老系统。
方法2:在我的文章中有提及定义非标准化内容由统一脚本去执行的解决方案。
以下内容节选自《自动化运维体系建设关键点分析——以某大型金融企业为例》
“B.应对非标准化的节点属性。节点属性可定义可不定义,在平台后端以KEY-VALUE的数据形式存放。设计这个属性的初衷是为了应对非标准化的情形。例如,软件安装路径在不同节点上不一致,就可以定义一个软件安装目录(app_directory)的属性,其值就是该节点上软件的绝对路径,这样就可以通过脚本对同一属性名称的引用,来完成对所有节点中软件安装目录的遍历。当然,如果路径都统一,这些个性化属性就可以不定义,直接存放在统一脚本中。非标准化情况越多,需要定义的属性内容就越多,我们通过这种形式变相地鼓励运维人员去尽量地完成标准化工作。”
如图所示
jt6kzenqgce

jt6kzenqgce

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

3

添加新评论2 条评论

thinkcthinkc系统架构师, 某司
2019-02-04 15:36
根据几年实际经验,自动化和人工还是得有机结合,完全自动化就是给自己挖坑
michael1983michael1983技术总监, 某证券
2019-01-31 14:43
自动化运维之路路漫漫
Ctrl+Enter 发表

本文隶属于专栏

活动总结
活动总结是社区交流活动内容的总结及延伸,为大家提供了社区专家们丰富且高水平的理论知识、实践经验以及常见问题的最佳解决方法,非常值得大家收藏学习。

作者其他文章

相关文章

相关问题

相关资料

X社区推广