运维数据的统一治理问题是不是运维自动化的先行条件?

关于运维自动化,运维自动化应该实现哪些目标?个人认为运维自动化在现阶段来讲就是要实现运维数据的自动化采集,运维数据的自动化分析,运维监控的自动化和运维告警的智能化,运维工具和运维操作的自动化和智能化。要实现这一系列的事情我觉得必须得以数据为基准,首先就是关于数据...显示全部

关于运维自动化,运维自动化应该实现哪些目标?

个人认为运维自动化在现阶段来讲就是要实现运维数据的自动化采集,运维数据的自动化分析,运维监控的自动化和运维告警的智能化,运维工具和运维操作的自动化和智能化。要实现这一系列的事情我觉得必须得以数据为基准,首先就是关于数据采集的问题,不同的终端具有不同格式不容内容的日志数据,目前来讲还没有一个可行的标准来贯彻。接着,就是数据入库的问题,无论是CMDB还是其他的方式,总而言之要从采集过来的日志进行抽取入库,将有用的信息入库格式化,那么如何分清楚是否有用?以什么样的格式加工入库比较有意义,我想目前来讲CMDB算是比较合理的一种方式,但是是不是最合理的呢?再有,就是对数据的分析,有些数据需要实时报警,有些数据需要结合历史数据的惯性轨迹来进行分析,有些数据需要长时间积累之后抽取出有意义的性能曲线,有些数据需要结构化的分析,有些数据可能需要结合非结构化的分析。

总而言之,数据的分析也不仅仅是简单的条件查询或者累计,需要一种合理的方法和平台来实现。最后就是关于数据的利用,有了这些数据之后,我们可以根据数据的分析结果来判断后续的运维操作,无论是故障诊断和处理还是说日常的运维变更批量化,都需要数据的支持,根据不同的数据结果来判断下一步的精准运维操作,这个过程相信也是需要将逻辑和数据高度结合才能完成的更有意义。

说了这么多,其实贯穿始终的最重要的就是数据的处理,从原数据到不同层面的加工数据,从原始的采集积累到后续的数据分析和处理。对于大多数企业的运维来讲都是从好多年的历史发展形成今天的局面,不同年代的不同格局和技术发展导致我们没办法进行一刀切式的升级换代,在这种情况下,要想实现真正的运维自动化是不是该先想好自己的运维数据治理问题才能往下进行?

收起
参与33

查看其它 8 个回答zjwy82的回答

zjwy82zjwy82  系统架构师 , bank

首先我表达个人观点,运维数据统一治理并非自动化的先行条件,需要先把运维数据概念的定义以及自动化运维的覆盖范围厘清。我更倾向于配置管理是自动化运维的先决条件。
先说说对运维数据的理解,我所认为有几类,一类是描述生产资源的数据即我们常说的配置数据,另一类是生产资源运行过程中产生的数据。配置数据也可以理解为是数据中心内部的主体,都在围绕他开展各项工作。这如我们做一次运维需要知道是为哪个对象,是设备加电还是数据库打补丁或是应用程序版本升级,这里所提到的设备、数据库软件、应用都是配置信息的一份子。
自动化运维是一个有广度有深度的任务,可以有不同角度的细分。按技术架构分层可以有应用部署自动化,基础软件部署自动化,计算资源自动化,每一项之间都有互相联系,也都有特定领域实践。从深度上就需要考虑自动化串联、审计、效果度量。一如我们当前所熟悉的云平台,是一个典型的资源供给自动化/自服务,实现资源供给管理是最基础的自动化,这仅仅依赖于配置信息管理即可完成。那如果要对资源弹性供给则需要对资源使用、运行支撑业务、应用架构等都有详细的管理才能做好。所以在不同管理需求/成熟度要求的前提下,自动化对运维数据有不同范围的依赖。
那有问题说我要做一个最完善的自动化,所以我要做好全运维数据的统一治理。这个问题很复杂,运维数据有很大一部分是由应用程序产生,需要有各种依赖,与组织分工、技术标准以及规划管理都有很大关联,可以在分步推动运维数据治理和自动化。

银行 · 2019-11-13
浏览3286

回答者

zjwy82
系统架构师bank

zjwy82 最近回答过的问题

回答状态

  • 发布时间:2019-11-13
  • 关注会员:12 人
  • 回答浏览:3286
  • X社区推广