运维数据的统一治理问题是不是运维自动化的先行条件?

关于运维自动化,运维自动化应该实现哪些目标?个人认为运维自动化在现阶段来讲就是要实现运维数据的自动化采集,运维数据的自动化分析,运维监控的自动化和运维告警的智能化,运维工具和运维操作的自动化和智能化。要实现这一系列的事情我觉得必须得以数据为基准,首先就是关于数据...显示全部

关于运维自动化,运维自动化应该实现哪些目标?

个人认为运维自动化在现阶段来讲就是要实现运维数据的自动化采集,运维数据的自动化分析,运维监控的自动化和运维告警的智能化,运维工具和运维操作的自动化和智能化。要实现这一系列的事情我觉得必须得以数据为基准,首先就是关于数据采集的问题,不同的终端具有不同格式不容内容的日志数据,目前来讲还没有一个可行的标准来贯彻。接着,就是数据入库的问题,无论是CMDB还是其他的方式,总而言之要从采集过来的日志进行抽取入库,将有用的信息入库格式化,那么如何分清楚是否有用?以什么样的格式加工入库比较有意义,我想目前来讲CMDB算是比较合理的一种方式,但是是不是最合理的呢?再有,就是对数据的分析,有些数据需要实时报警,有些数据需要结合历史数据的惯性轨迹来进行分析,有些数据需要长时间积累之后抽取出有意义的性能曲线,有些数据需要结构化的分析,有些数据可能需要结合非结构化的分析。

总而言之,数据的分析也不仅仅是简单的条件查询或者累计,需要一种合理的方法和平台来实现。最后就是关于数据的利用,有了这些数据之后,我们可以根据数据的分析结果来判断后续的运维操作,无论是故障诊断和处理还是说日常的运维变更批量化,都需要数据的支持,根据不同的数据结果来判断下一步的精准运维操作,这个过程相信也是需要将逻辑和数据高度结合才能完成的更有意义。

说了这么多,其实贯穿始终的最重要的就是数据的处理,从原数据到不同层面的加工数据,从原始的采集积累到后续的数据分析和处理。对于大多数企业的运维来讲都是从好多年的历史发展形成今天的局面,不同年代的不同格局和技术发展导致我们没办法进行一刀切式的升级换代,在这种情况下,要想实现真正的运维自动化是不是该先想好自己的运维数据治理问题才能往下进行?

收起
参与33

查看其它 8 个回答杨文云的回答

杨文云杨文云数据库管理员GBS

也许问题的意思是运维数据要集中处理,个人经验觉得这种实现在实践中不容易实现。运维数据治理确实至关重要,但是集中处理并不合适运维管理平台化在一个平台做系统维护,要实现系统的定制,批量管理,日志的标准化,数据分析,量化,还是要定义一些数据分类的,这需要根据应用业务需要分类,量化,个人觉得这样更靠谱,更有实现的可能性。所以运维管理平台是自己作为一个系统维护,但是运维数据应该是各个应用系统自己维护治理。

按照标准去做本身没有什么问题,但是实施起来十分困难,系统的差异性已经存在了,生产上再去标准化不容易实施,就像IPv4到IPv6,是没办法一次性完全舍弃ipv4的。需要的是兼容,逐步标准化。而且运维的问题千差万别,很理想化的场景是设置一些规则能够通过日志或告警识别出问题 然后采取对应措施,但是我觉得能做到用一个小机器人准确的派发工单就不错了。主要是综合和复杂的情况太多了,如果是系统比较稳定,可能自动化运维还比较有效,如果是运维新的比如云项目之类的特殊情况太多了,可能要慎重。

IT咨询服务 · 2019-11-12
浏览3170

回答者

杨文云
数据库管理员GBS
擅长领域: 数据库云计算服务器

杨文云 最近回答过的问题

回答状态

  • 发布时间:2019-11-12
  • 关注会员:12 人
  • 回答浏览:3170
  • X社区推广