我们的存储在日常运行过程当中会积累下很多的性能数据,有的是统计端口指标,有的是统计缓存等资源利用情况,有的是磁盘读写指标,有的是压力分布指标。其实这些数据是存储运维过程中最重要的数据,如果能做到如下两点,那么对于我们的运维来说可谓事半功倍:
目前华为存储DeviceManager能够做到实时及历史性能展示(中端存储由于架构问题无法展示历史性能),能够展现出一些用户关注的性能指标。不过目前应该还做不到性能分析,我们实践的方案是通过性能数据转储、解析后将数据吐给Kafka,AIops根据现有的分析模型去消费这些数据。对于业务性能映射到io指标的细颗粒度,存储上的lun_group的IOPS等指标有一定的参考性,我们把这个数据跟主机的iostat进行结合分析,能够更好的去定位。
收起华为存储高中低端均通过统一管理界面 DeviceManager 进行管理和配置,同时也配套有性能监控工具 Systemreporter 、日常巡检工具、部件更换工具、批量配置功能辅助工具或者功能,通过不断的提升产品的运维能力和丰富运维工具,简化日常的运维工作,提高运维的效率。除此之外,还有专门作为容灾管理软件的 BCManager 以及存储统一管理软件 DME 等,极大地简化了存储运维工作,使得运维可视化,操作简便。
收起