企业有非常多的核心系统中,如何衡量监控系统的质量状况,大家是如何做的?
当然是指标啦,数字说明一切,常见的指标:
* 故障告警时延1分钟以内
* 误报率0.5%以下
* 准确率99.5%以上
* 漏报率0.1%以下
* 监控系统平台化,支持业务自定义监控,具有自助服务平台
* 支持趋势监控
* 监控可视化
* 可自定义粒度
* 易用性
误报率 = 误报次数/总告警次数
漏报率 = 漏报次数/总告警次数
准确率 = (总告警次数 - 误报次数 - 漏报次数 ) /总告警次数
至于误报次数 漏报次数 可以采用抽样 + 制度的方式进行统计
是否是有效告警如何鉴定,这个直接关乎准确率的计算,靠人工鉴定?
想问一下如何定义监控系统的误报率、准确率、漏报率这几个KPI?没有计算公式的KPI接近于耍流氓。。。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30