监控告警工具是一方面,另一方面也需要从运维上进行提升:1.平时做好巡检。并不仅仅是硬件巡检,需要引入相应的服务商提供深入巡检,简单来说,就是要让他们检查我们平时看不到的log。有些蛛丝马迹是会记录在这些底层log里面的。2.完善应急预案。可以和同行以及厂商多交流,提出更多...
显示全部监控告警工具是一方面,另一方面也需要从运维上进行提升:
1.平时做好巡检。并不仅仅是硬件巡检,需要引入相应的服务商提供深入巡检,简单来说,就是要让他们检查我们平时看不到的log。有些蛛丝马迹是会记录在这些底层log里面的。
2.完善应急预案。可以和同行以及厂商多交流,提出更多可能的场景进行预案设计,并定期进行审核与更新。
3.经验交流。
收起