金融企业做AIOps,如何解决运维监控误报率高,以及时效性延迟?

监控和告警通常是AIOps中首先需要解决的问题,当前的告警机制大多基于单一指标的分布和阈值来判定,误报率非常高,而且在时效上具有一定的延迟性。如何解决这个 问题?大家采用什么方法

参与10

3同行回答

cherrylookcherrylook软件架构设计师中国人寿保险集团
告警本身是轻量级的程序,模型需要对大量的历史数据进行学习,如果存在时效性问题,还是要分清是由什么带来的,如果确实模型训练耗时真的非常严重,建议采用更高配置的GPU服务器。告警收敛需要结合聚类算法和专家经验进行,具体还需要结合应用场景才有意义。...显示全部

告警本身是轻量级的程序,模型需要对大量的历史数据进行学习,如果存在时效性问题,还是要分清是由什么带来的,如果确实模型训练耗时真的非常严重,建议采用更高配置的GPU服务器。告警收敛需要结合聚类算法和专家经验进行,具体还需要结合应用场景才有意义。

收起
保险 · 2019-04-17
浏览2048

提问者

chengfeiw
软件开发工程师中国银行

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2019-04-12
  • 关注会员:4 人
  • 问题浏览:3645
  • 最近回答:2019-04-18
  • X社区推广