存储性能和可用性监控的常用指标和注意事项?

券商核心交易系统对实时可用的要求极高,对存储的监控要求当灵敏甚至要有一定的前瞻性,监控没做好,问题一直潜伏,双活甚至可能在问题发生的时候都发挥不了作用。日常实践中,对双活存储配置,我们关心如下监控相关的问题:

  1. 常用的监控指标有哪些,有哪些重要关注点?
  2. 有没有什么最佳实践让监控有一定前瞻性,将问题消灭在未发生之时?
参与22

2同行回答

db2dummydb2dummy软件开发工程师IBM
自己补充一点,监控要做的第一件事情就是建立性能基线,没有性能基线,问题发生时不能及时发现,问题没发生时无法自证清白。显示全部

自己补充一点,监控要做的第一件事情就是建立性能基线,没有性能基线,问题发生时不能及时发现,问题没发生时无法自证清白。

收起
互联网服务 · 2017-09-13
浏览2131
nkj827nkj827项目经理长春长信华天
重点关注双中心间光纤交换机级联端口的状态、流量变化,避免发生链路抖动甚至断开;关注cluster中仲裁盘状态是否online可用;关注vdisk的mirror状态是否实时一致。svc节点ups有自动充放电机制,关注集群事件告警信息。性能指标主要包含双活SVC节点上的总的IOPS,IO响应时间,IO吞吐...显示全部

重点关注双中心间光纤交换机级联端口的状态、流量变化,避免发生链路抖动甚至断开;关注cluster中仲裁盘状态是否online可用;关注vdisk的mirror状态是否实时一致。svc节点ups有自动充放电机制,关注集群事件告警信息。

性能指标主要包含双活SVC节点上的总的IOPS,IO响应时间,IO吞吐量,FC卡的流量,FC端口状态,光功率等,还可以针对某个卷进行专门的指标监控,如果是VDM的话,还可以监控VDM间的写延迟时间等。
两个数据中心间的链路是重点监控对象,看光功率,状态,流量,带宽等等。
目前SVC主要还是通过TPC进行针对性的监控,链路主要是波分设备厂商提供的监控软件。如果没有走波分设备,而是两个数据中心间的SAN直连,可以直接监控SAN交换机即可。

收起
系统集成 · 2017-09-13
浏览2260

提问者

db2dummy
软件开发工程师IBM
擅长领域: 双活存储存储选型

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2017-09-13
  • 关注会员:2 人
  • 问题浏览:4827
  • 最近回答:2017-09-13
  • X社区推广