郑金辉
作者郑金辉·2023-07-26 11:20
技术总监·某公司

再谈智能运维:从手工到自动

字数 1653阅读 643评论 0赞 2

前几天看计世资讯的报告,核心观点是PaaS的黄金发展期到了,我非常认同。其实随着平台从IaaS上升到PaaS,系统复杂度日益提高,自动化运维(智能运维、AIOPS、IToA、IToM...)的机会也到来了,最近好件事都跟自动化运维相关,就是最好的证明。

一、我们看到的一些趋势

1、巨头们是怎么看的

Gartner认为, 自动化运维是通过工具或者平台,实现IT基础设施和应用的日常任务和运维流程自动化,从而提高效率,降低风险,促进组织业务能力提升。主要包括:日常任务处理自动化、运维流程自动化、IT服务自动化、业务服务自动化以及整体运维运营能力升级等内容。从成熟度模型上说, Gartner将企业实施自动化的成果分为起步、基本、标准、合理、动态等5个阶段,在每个阶段定义了企业应该达成怎样的目标。基本可以分成基础架构自动化、应用自动化、IT服务自动化以及业务运营自动化等几个层次。

2、从运维到运营

运维已经脱离原始的意义,不在只是针对运维的对象的一些维护管理工作,也不仅仅是用工具和自动化的手段解决原来人工无法处理的 维护管理动作规范化、批量化、自动化,而是在向运营方向演进。运维,只能解决或者,运营才能实现活得好。无论哪个行业的IT其实存在新旧两种架构模式, 要在传统IT架构和新的IT架构之间,我们一直在寻求一种平衡和结合点,使我们的IT达到一种动态的平衡。

3、传统行业与互联网行业的IT代差

由于自身IT规模、投入、IT效价和发展时间的差距,国内IT发展水平差异度明显,特别是传统企业和BAT之间的差距有明显的代差。整个IT运维处于整合新老工具、更新替代旧架构的转型关键时期。未来IT运营的方向,就是必须打造涵盖硬件监控,性能调优,资产管理、报警中心、故障自动修复、故障预测、智能节能的一整套基于混合IT架构的新“监、管、控”的闭环解决方案。需要从原有的基于人工的被动响应,转变为更高效,更智能化的运维体系,实现基于运维数据的分析能力,对数据进行洞察。

二、智能运维运维平台的关注点

1、从分散到集约

智能运维正从原来的分散式的工具运维阶段向平台运维阶段转型,主要体现在这几个方面:平台必须具备良好的兼容性,可以实现对IT资产的全面纳管;可以兼容和平滑替代现有的运维工具和手段;可以实现更多的运维需求,至少有一个美好的愿景;具备一定智能化演进的基础和可能性。

2、一些具体问题

俗话说,心有猛虎,细嗅蔷薇。愿景是美好的,现实也是残酷的,很多客户还停留在手工运维阶段,甚至没有合适的运维工具和手段,尽管对上面的趋势非常认同,但是还得脚踏实地。比如经常就会遇到工具的选择问题,当然选择成熟套装软件的土豪客户也是很多的,但是不耽误咱们分析一些基础的问题。比如对于基础运维工具的原则,像Puppet、Saltstack和Ansible。一般说:

1)Puppet:

使用Ruby开发,脚本语法复杂,且可移植性比较差,目前的使用者慢慢变少。客户端可以提供详细、深入的报告能对节点进行配置,比较受技术流的喜欢。

2)Saltstack:

Ansible和SaltStack使用python编写,具有良好的可移植性。SaltStack通过ZeroMQ传输数据,SaltStack的响应速度要比Ansible快很多,从测试报告上看命令下发和批量执行,几乎快10倍,不过一般运维的场景对速度要求不高,所以这个优势并不明显。安全性上,毕竟有客户端,增加了客户端所在的宿主机的安全暴露面,始终是一个隐患。

3)Ansible:

据说Ansible很火,采用SSH连接,从测试报告上看一般并发可以到200左右,虽然速度慢,但是够用。安全性比Saltstack要好一些,毕竟没有驻留程序。Ansible自身的运维也比Saltstack更轻松一些,也可以实现微服务化。

其实吧,这种技术框架和路线的选择,说是很严谨,还是有很多主观的因素在里面,有技术主管的个人意愿和情绪在里面,也需要考虑客户的实际情况。当然,ITOM还远不止这些,能做的需要做的,还有很多很多。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广