我们知道,报警的报警阀值是很难设立的,通常我们会选用基线来定阀值,但如果有异构存储的话,底层的存储是不一样的,那IO就有可能时快时慢,请问,我如何设置这种阀值呢?
您提的问题非常好~
这个问题建议分三个层面来解决:
1.业务逻辑层:无论何种架构,银行业务上线前的架构设计、投产评审都会有相关业务的访问逻辑和使用高峰与特点,如实时交易类的系统对随机读写访问IO要求较高,主要集中在日间;而监管报送类系统需要在夜间进行批量操作,对批量时间又要求,因此IO会以大量的写操作为主;因此IO阀值会根据不同业务系统的峰值进行设置,以这个标准去匹配性能能够达到要求的存储设备,再配合系统监控的磁盘繁忙百分比和关键业务指标,多角度综合判断会比较合理。
2.系统层面:在系统集成完成后,通常会进行压力测试,数据体量规模,在业务层面打压,给出系统可以承受的极值,并根据业务正常相应的压力值,设置极限IOPS值,再按百分比设置告警值(例如85%),另外可以通过IOMETER或PYTHON等的存储性能工具在搭建好的系统运行一下,根据极限值的百分比设置阀值
3.存储层面:在异构存储监控软件或存储厂商自带的监控软件中,收集并分析一段时间映射给主机LUN的IOPS情况,并根据存储访问峰值和存储自身指标设置告警阀值。
综合参考以上,进行IOPS阀值综合设置,同时还要参考其他指标综合来看