在电信运营商一体化监控项目中,海量告警信息怎么做到快、准、全?

1回答

匿名用户匿名用户
michael1983赞同了此回答
参考阿里妈妈的Goldeneye产品:  上图为阿里妈妈Goldeneye 产品的技术架构,为了进行告警信息的快准全,采用了阈值预测、监控检测、报警生成&通知、辅助定位这四部分进行协同完成。系统可以自动判断哪些目标需要监控、自动设定监控目标的阈值水位、不用人力维护,基于对历...显示全部

参考阿里妈妈的Goldeneye产品:
 

上图为阿里妈妈Goldeneye 产品的技术架构,为了进行告警信息的快准全,采用了阈值预测、监控检测、报警生成&通知、辅助定位这四部分进行协同完成。系统可以自动判断哪些目标需要监控、自动设定监控目标的阈值水位、不用人力维护,基于对历史样本数据统计分析得出判断依据。
Goldeneye 处理监控的四大输入:实时监测数据、历史数据、预测策略、报警过滤规则,进行预测策略,主要包括:
(1)阈值参数:设置基于预测基准值的系数决定阈值上下限区间、分时段阈值预测系数、分报警灵敏度阈值预测系数;
(2)预测参数:样本数量、异常样本过滤的高斯函数水位或者过滤比例、基于均值漂移模型的样本分段选取置信度等。
 
目前火热的动态阈值概念对于告警信息不会造成信息洪峰也有很大的帮助,动态阈值预测的步骤主要是这样的:
(1)样本选取:根据自己的需要,一般建议选取过去 50 天左右的样本。
(2)异常样本筛除:这个过程主要使用高斯分布函数过滤掉函数值小于 0.01,或者标准方差绝对值大于 1 的样本。
(3)样本截取:因为后来我们优化的版本,在(2)的基础上使用均值漂移模型对历史样本在时间序列上进行分段检验,如果有周期性变化、或者持续单调变化,则会反复迭代均值漂移模型寻找均值漂移点,然后截取离当前日期最近第一段(或者可以理解为最近一段时间最平稳的样本序列)。样本选取还有一个需要注意的问题,节假日和工作日的样本要分开选取,预测工作日的阈值要选择工作日的样本,节假日亦然,也就是对预测样本从日期、周末、平稳性三个维度拆分选取。
(4)预测基准值:经过(2)和(3)的筛选、截取,剩下的样本基本上是最理想的样本了,在此基础上,保持样本在日期上的顺序,按指数平滑法预测目标日期的基准值,得到基准值以后根据灵敏度或阈值系数,计算阈值上下限。
 

收起
 2019-08-19
浏览120

问题状态

  • 发布时间:2019-08-16
  • 关注会员:2 人
  • 问题浏览:600
  • 最近回答:2019-08-19
  • 关于TWT  使用指南  社区专家合作  厂商入驻社区  企业招聘  投诉建议  版权与免责声明  联系我们
    © 2019  talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30