bijingrui
作者bijingrui·2023-01-28 13:31
系统运维工程师·卡中心

如何建立基础架构标准化的运维体系(一)

字数 1496阅读 2370评论 0赞 5

如图镇楼。愿,运维安全,但标准先行。

标准先行

以规矩成方圆。

标准化工作是运维过程中最基础、最重要的,但也是最容易被忽视的一个环节。作为系统运维本身的工作繁杂无序、且需要运维的对象覆盖面较广。如若在没有执行标准的前提下盲目开展工作,结论必是运维工作的千人千面,这可不是什么好事情。隐藏在冰面之下的将是各式各样的生产问题、隐患,同时阻碍运维工具、平台的建设,最终运维的工作会倒在质量、成本和效率三座大山前,止步不前。

标准的制定必须在工作开展之前完成,为运维人员在工作时提供指引。

如何标准

三思而行。

2019年,ITIL4 标准正式发布,重点聚焦企业 IT管理的价值。随着技术的快速发展,业务迭代加速,外部形势越来越严峻,IT组织面临越来越多的杂乱无章的工作,ITIL4 提出标准化、自动化服务价值流,释放 IT人力创造新的价值 。 实际上运维管理者的心中对于ITIL这句口号是认可和支持的,为什么称之为口号?因为缺乏实际的执行落地的细化思路。

正如上文所说,运维的工作的特点,一是业务流程的承上启下,上需面对研发提出的需求,下需对接下游的各类基础设施;二是繁多复杂的运维对象,不做列举。

那么如何制定、执行以及有效落实各类的标准。

方法论上,从三个角度上来考量流程、工具、人。

  • 关于流程,将流程标准拆分为审批流和工作流两类。审批流描述工作流是否被允许执行、是否合规、是否符合管理方的要求。主要体现在管理方对于运维对象的管理,标准的落地执行需要依靠工作流是否完善。
  • 关于工具,有标准的审批流以及工作流,加之工具平台对审批、工作两条流程的固化。一方面将标准落地;另一方面将工作自动化,进一步为服务化提供脚手架能力。
  • 关于人员,着重强调必须弱化对人的要求,人是导致千人千面问题的重要因素之一。管理要求可以对运维人员提出诸多要求,但实际执行过程中往往存在偏差,管理者需要耗费大量精力来纠偏,存在一个恶性循环。

那么三思之后,具体如何来做?

先来看看这些问题,您是否能回答的出来:

怎样才算标准?什么东西需要做标准?不做标准有什么问题?如何才能做到标准?

怎么标准

标准,意为以达成某项业务流程为目的,在组织内部形成落地过程的最佳实践。即标准为当前组织中的最佳实践。

哪些内容需要标准

拆解1:组织内运维涉及哪些领域?

先来将运维工作中涉及的各类专业领域划分一下。

标准化的过程实际上就是对运维对象的识别和建模过程 这是引用赵成在极客时间《赵成的运维体系管理课》中的一句话。理解下来分三步来细化制定和执行标准:

第一、运维对象,所属团队中运维的对象有哪些?确定管理方的职责,制定审批流程;

第二、识别对象生命周期,以及每个生命周期阶段中的运维场景,确定工作流程;

第三、以场景流程中的事件进行驱动,对每个流程事件进行自动化,有PaaS平台进行标准固化;

简单罗列一下:

基于以上三点,如图所示,将基础架构的能力标准化、原子化、场景化:

(1)最小化原子能力:基于运维对象原子能力的标准化改造,实现运维场景的标准化构建,基本完成应用发布、资源交付。例如,某个中间件的部署

(2)运维场景原子能力:基于标准化的运维场景,重组合形成运维领域的标准化能力。例如基于多种中间件、网络、监控等资源原子能力重组合形成的发布平台

(3)运维领域标准能力:对于多种运维场景的重组合,可以形成某个运维领域的数字化能力。例如基于操作系统、中间件、网络、监控、容器等等资源原子能力重组合形成的系统稳定性领域的混沌工程

拆解2: 领域中的对象如何识别

对数据建模,强调的是CMDB,原则上所有的运维对象均需要在CMDB中进行建模。通过应用工程以业务系统为顶层视角,从上至下进行血缘关联。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

5

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

最佳实践
不同的领域,都有先行者,实践者,用他们的最佳实践来加速更多企业的建设项目落地。

作者其他文章

相关文章

相关问题

相关资料

X社区推广