存储性能监控模块是否能做到有效数据分析?

我们的存储在日常运行过程当中会积累下很多的性能数据,有的是统计端口指标,有的是统计缓存等资源利用情况,有的是磁盘读写指标,有的是压力分布指标。其实这些数据是存储运维过程中最重要的数据,如果能做到如下两点,那么对于我们的运维来说可谓事半功倍:

  1. 可以基于周期性的历史数据,从不同维度进行趋势性分析。
  2. 可以让用户通过自定义的方式将业务性能映射到io指标的细颗粒度分析上。
参与12

2同行回答

nkcsxuEynkcsxuEy存储工程师某股份制银行
目前华为存储DeviceManager能够做到实时及历史性能展示(中端存储由于架构问题无法展示历史性能),能够展现出一些用户关注的性能指标。不过目前应该还做不到性能分析,我们实践的方案是通过性能数据转储、解析后将数据吐给Kafka,AIops根据现有的分析模型去消费这些数据。对于业...显示全部

目前华为存储DeviceManager能够做到实时及历史性能展示(中端存储由于架构问题无法展示历史性能),能够展现出一些用户关注的性能指标。不过目前应该还做不到性能分析,我们实践的方案是通过性能数据转储、解析后将数据吐给Kafka,AIops根据现有的分析模型去消费这些数据。对于业务性能映射到io指标的细颗粒度,存储上的lun_group的IOPS等指标有一定的参考性,我们把这个数据跟主机的iostat进行结合分析,能够更好的去定位。

收起
银行 · 2021-01-18
浏览1317
guwenkuanguwenkuan联盟成员系统架构师金融
华为存储高中低端均通过统一管理界面 DeviceManager 进行管理和配置,同时也配套有性能监控工具 Systemreporter 、日常巡检工具、部件更换工具、批量配置功能辅助工具或者功能,通过不断的提升产品的运维能力和丰富运维工具,简化日常的运维工作,提高运维的效率。除此之外,还有...显示全部

华为存储高中低端均通过统一管理界面 DeviceManager 进行管理和配置,同时也配套有性能监控工具 Systemreporter 、日常巡检工具、部件更换工具、批量配置功能辅助工具或者功能,通过不断的提升产品的运维能力和丰富运维工具,简化日常的运维工作,提高运维的效率。除此之外,还有专门作为容灾管理软件的 BCManager 以及存储统一管理软件 DME 等,极大地简化了存储运维工作,使得运维可视化,操作简便。

收起
银行 · 2021-01-18
浏览1348
  • 再补充一点: 这里我们要明确一个概念,性能监控和性能分析是两件事。监控只是按预设周期收集采样数据并展示的环节,分析则有一个计算、判断、多维度综合考虑的过程。字面上来说,我认为常规意义上的监控模块是做不到有效数据分析的,一般都要结合专门的分析模块。有的模块可以做到自己分析自家设备的性能状态,通过一些算法和规则的结合,将压力比较大的环节高亮出来,比如CPU或硬盘。有的产品可能做的更好一些,可以收集上下游产品的性能数据,甚至可以实现全链路端到端的采样分析,从而快速定位或者预警性能问题,当然前提是需要相应设备厂商的接口开放,并且也只是可以借鉴但不能简单的做为唯一标准。 总之,性能问题是一个很宽泛的命题,问题定位、评估、调优,都需要系统的、全面的考量,不能草率的定论一定是某个环节的问题,也不能忽略任何微小的细节。在我看来,一个持续稳定运行的架构,突然发生了性能问题,那一定是某个环节发生了“change”,排查的过程就是找出“change”发生在哪一环的过程,只有综合分析,才能真正彻底的搞清楚根本原因。
    2021-01-18

提问者

haizdl
haizdl101634
技术经理大连
擅长领域: 灾备存储服务器

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2021-01-13
  • 关注会员:3 人
  • 问题浏览:1947
  • 最近回答:2021-01-18
  • X社区推广