查看其它 1 个回答cherrylook的回答

cherrylookcherrylook软件架构设计师中国人寿保险集团

困难有很多,主要分数据、算法、平台三个方面吧。
首先是数据采集方面主要是各类日志数据需要进行统一,海量的运维数据需要大量存储资源等。在做智能化算法初期,主要是缺少对历史异常数据的记录和日志数据格式的统一,通过无监督学习算法对未标注数据进行异常检测后难以判定是否有误告或者漏报的情况,短时间很难提高算法的准确性。为此我们经过了很长一段时间的累积,一方面累积适合的历史数据,另一方面也投入了很多专家人力协助我们去评定监控的效果,一点一点进行提升。
算法方面,目前对单一场景的监控、异常检测准确率还可以,但是对根因分析方面还是不是特别深入,可以将问题的链路串联起来,但是比较难以去预防故障发生。
平台方面主要涉及一套体系化的架构设计,这方面我们也充分借鉴了一些外部资源进行技术咨询,结合公司自身的运维监控体系去搭建的一套自适的平台。

保险 · 2019-04-18
浏览2291

回答者

cherrylook
软件架构设计师中国人寿保险集团

cherrylook 最近回答过的问题

回答状态

  • 发布时间:2019-04-18
  • 关注会员:3 人
  • 回答浏览:2291
  • X社区推广