在大量的告警和异常检测结果中如何找到根源故障 如何借助算法提供的模型或规律辅助判断故障根本原因 专家经验或规则和其他运维数据如何与算法结合准确定位根源
在初期阶段,对于未标注的数据,我们通过无监督学习算法对疑似异常数据进行识别,并将结果反馈给运维专家进行二次经验判定,来调整告警的准确性。在长期的项目中,将专家在日常运维中发现的异常数据纳入标注的数据池中,通过有监督的机器学习算法训练。将多种异常检测的算法进行集成来提高告警的准确性。具体实现需要结合场景、算法、专家判断综合探索,无法一概而论
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30