咨询:通过近两年证券期货安全通报,可知悉有几起光路,存储故障导致交易中断、延迟事故,
行业是否有相关产品或工具可实现实时告警、快速定位故障、性能审计功能,当存储性能异常出现不能满足正常性能开销时,管理员能第一时间发现定位问题,以进行应急处理减少影响?
监控告警工具是一方面,另一方面也需要从运维上进行提升:
1.平时做好巡检。并不仅仅是硬件巡检,需要引入相应的服务商提供深入巡检,简单来说,就是要让他们检查我们平时看不到的log。有些蛛丝马迹是会记录在这些底层log里面的。
2.完善应急预案。可以和同行以及厂商多交流,提出更多可能的场景进行预案设计,并定期进行审核与更新。
3.经验交流。