我们日常运维都是仅仅做到告警或诊断,很少有做到自动修复故障的,不知道专家们有没有这方面的产品介绍?感觉这块非常难做,尤其是做成通用产品
对于告警后的自动化处理要分两个层次考虑,一个就是在运维过程中我们总结出哪些报警一出现就知道100%这个问题,那我们才有可能进行自动化脚本处理,例如:weblogic的wlst脚本的ping,不通的话就可以重新启动服务等。另外一个层次就是根据以往问题的发生的次数,总结出判定规则,根据规则进行手工审核,然后自动化脚本执行。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30