互联网服务异构存储监控

异构存储的监控后的报警标准?

我们知道,报警的报警阀值是很难设立的,通常我们会选用基线来定阀值,但如果有异构存储的话,底层的存储是不一样的,那IO就有可能时快时慢,请问,我如何设置这种阀值呢?显示全部

我们知道,报警的报警阀值是很难设立的,通常我们会选用基线来定阀值,但如果有异构存储的话,底层的存储是不一样的,那IO就有可能时快时慢,请问,我如何设置这种阀值呢?

收起
参与5

查看其它 1 个回答zhangpeng4007的回答

zhangpeng4007zhangpeng4007系统运维工程师某城市商业银行

您提的问题非常好~
这个问题建议分三个层面来解决:
1.业务逻辑层:无论何种架构,银行业务上线前的架构设计、投产评审都会有相关业务的访问逻辑和使用高峰与特点,如实时交易类的系统对随机读写访问IO要求较高,主要集中在日间;而监管报送类系统需要在夜间进行批量操作,对批量时间又要求,因此IO会以大量的写操作为主;因此IO阀值会根据不同业务系统的峰值进行设置,以这个标准去匹配性能能够达到要求的存储设备,再配合系统监控的磁盘繁忙百分比和关键业务指标,多角度综合判断会比较合理。
2.系统层面:在系统集成完成后,通常会进行压力测试,数据体量规模,在业务层面打压,给出系统可以承受的极值,并根据业务正常相应的压力值,设置极限IOPS值,再按百分比设置告警值(例如85%),另外可以通过IOMETER或PYTHON等的存储性能工具在搭建好的系统运行一下,根据极限值的百分比设置阀值
3.存储层面:在异构存储监控软件或存储厂商自带的监控软件中,收集并分析一段时间映射给主机LUN的IOPS情况,并根据存储访问峰值和存储自身指标设置告警阀值。
    综合参考以上,进行IOPS阀值综合设置,同时还要参考其他指标综合来看

银行 · 2020-06-19
浏览836

回答者

zhangpeng4007
系统运维工程师某城市商业银行
擅长领域: 存储灾备服务器

zhangpeng4007 最近回答过的问题

回答状态

  • 发布时间:2020-06-19
  • 关注会员:3 人
  • 回答浏览:836
  • X社区推广