郑金辉
作者郑金辉·2023-08-07 14:22
技术总监·某公司

新型运维体系建设的思考

字数 1599阅读 678评论 0赞 6

在数字化转型的大背景下,我们的架构和技术实现方式都发生了很大变化,也直接或者间接影响了我们的运维体系和运维组织模式。最近很多客户沟通十四五规划的时候都会谈到一个不好回避的话题,那就是运维变革。我们都知道运维已经到了变革的关口,但具体如何改变,其实也没有定论。我试着把我自己的理解写出来,供大家讨论。

一、哪些东西发生变化了

自从基础设施云化的大门打开以后,从运维的角度来看,很多东西都发生了变化,包括运维对象、运维流程、运维工具到协同关系等等各方面。

首先运维对象在机房动环、物理设备基础上增加了虚拟机、云平台、容器、PaaS组件、应用系统等软件层面的元素;

运维流程从以故障和事件为触发的被动响应模式向以应用持续稳定运行为目标的主动支撑模式转型;

运维工具也从监控和处置分离的简单工具时代向以全流程监控、联动处置和智能分析为核心的智能运维平台转型;

协同关系从流程化的线性协同关系变成了多层级多角度的网格化协同关系。

从稳态到敏态,传统运维势必会从稳定性保障的后台角色逐渐走向IT运营的中心,成为IT价值体现的关键环节。

二、以后运维干什么

其实上面这些趋势都是大家能看得到,至于以后的运维具体需要做什么,还是有必要深入研究。从运维发展演进的角度分析,主要包括基础运维平台、PaaS平台运维、持续交付以及运营体系建设等几个方面。

1、基础运维平台:这部分是延续以前传统运维的内容,但是最大的变化是从以资源为核心的基础服务,向以应用配置管理为核心转型,比如,CMDB的建设也会在资源状态和资产信息的基础上增加应用配置、应用关联关系等内容,同时需要开展运维对象的识别和运维标准化的工作。这部分是运维的基础和核心。

2、PaaS平台运维:PaaS平台尤其是PaaS基础环境会在以后的IT架构中发挥越来越重要的作用,针对这部分系统的运维也会成为新型运维体系的重要内容。针对这部分架构的服务化和标准化工作,不只是建设部门的任务,更是运维团队的核心工作,也是运维和技术架构产生割裂的重要原因。

3、持续交付管理:持续交付体系是拉通运维和开发的关键环节,从应用全生命周期管理的角度出发,去关注应用的创建、持续集成以及线上运行阶段的资源弹性管理,都是运维需要关注的内容,需要处理好运维和研发的协同关系。

4、运营体系建设:运营体系建设的前提是智能运维平台的建设和交付,在实现运维标准化的前提下,结合传统运维的痛点,做好监控平台、自动化工具平台以及智能运维分析平台等关键性工作平台建设,同时关注服务目录迭代和演进,关注标准、规则、制度和流程的建设,关注服务的全过程管理和服务的推广工作。

以上是转型背景下,新型运维体系需要关注的重点工作,但是这并不意味着运维组织需要按照以上工作进行重组,通常这些工作在新的运维组织内部会以虚拟团队的方式进行组织。所以,我们可以大概可以预见到新的运维组织基本会是矩阵型的。

三、运维组织会怎样变革

其实大家关注的焦点之一就是运维组织如何变革。这要先从运维协同关系的变化谈起。新型运维体系的协同关系必然不是线性的,而是网格化的,以上那些工作必然不是运维团队自己就能做好的,而是需要跨团队跨组织去协同,要站在如何发挥技术架构能力的视角去考虑运维,而不只是仅仅考虑运维能力本身如何建设。

至于运维组织本身的变革,我个人认为,组织内容会逐渐呈现横向整合的趋势,也是为了适应技术架构,大致会分成基础运维(主要是IDC、硬件、系统、网络以及云)、应用运维(重点是业务层和应用服务层的稳定性和持续服务能力保障)、数据运维(数据相关的运维甚至运营工作)、运维开发(运维平台的建设和开发管理)。这基本上是实体运维组织的大致划分。但是这不是全部,在组织架构的角度,还会依据上面描述的未来运维的重点工作,实现运维的纵向穿透,打造跨专业的虚拟运维团队,这个虚拟团队甚至还会包括运维以外的组织和团队。所以说,运维组织未来会呈现矩阵化的格局。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

6

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广