金融企业做AIOps,如何解决运维监控误报率高,以及时效性延迟?

监控和告警通常是AIOps中首先需要解决的问题,当前的告警机制大多基于单一指标的分布和阈值来判定,误报率非常高,而且在时效上具有一定的延迟性。如何解决这个 问题?大家采用什么方法...显示全部

监控和告警通常是AIOps中首先需要解决的问题,当前的告警机制大多基于单一指标的分布和阈值来判定,误报率非常高,而且在时效上具有一定的延迟性。如何解决这个 问题?大家采用什么方法

收起
参与10

查看其它 2 个回答cherrylook的回答

cherrylookcherrylook软件架构设计师中国人寿保险集团

告警本身是轻量级的程序,模型需要对大量的历史数据进行学习,如果存在时效性问题,还是要分清是由什么带来的,如果确实模型训练耗时真的非常严重,建议采用更高配置的GPU服务器。告警收敛需要结合聚类算法和专家经验进行,具体还需要结合应用场景才有意义。

保险 · 2019-04-17
浏览2024

回答者

cherrylook
软件架构设计师中国人寿保险集团

cherrylook 最近回答过的问题

回答状态

  • 发布时间:2019-04-17
  • 关注会员:4 人
  • 回答浏览:2024
  • X社区推广