个人感觉,存储性能指标都很成熟了,主要就是吞吐量,iops,延迟,容量利用率,磁盘利用率等等,想稳妥点,结合实际应用吧,冗余量放大一点。分布式存储监控更麻烦点。
存储本身有这个检测工具吧。一般SSD剩余使用寿命低于某个阈值后都会告警,无需太多担忧。
目前存储这几家大厂的产品在稳定性、可靠性上做的都比较成熟了。性能监控上,华为存储的DeviceManager能够做到实时及历史性能展示,可以展现出一些用户关注的性能指标。同时,我们在实践中通过性能数据转储、解析后将数据吐给Kafka,AIops根据现有的分析模型去消费这些数据,能够...
您好,异构存储监控平台是全面收集存储性能日志的平台,区别与snmp协议收集的告警日志之外,还会收集和分析性能数据,但该平台通常仅赋予监控权限,不会赋配置权限,异构存储统一配置通常会使用存储虚拟网关或后端可挂载其他存储的高端存储设备...
(1)这个要实现的话,要么商业化产品,比如听云等,(2)要么对存储厂商公布出的api自己开发,这个用python来写,只要api完整,应该可以实现。从api抽取数据到一个中间数据库,然后,用jango或flash展现出来。...
通过SNMP trap或者syslog将错误信息自动发出去,如果有短信平台,可以直接发到短信平台;2.买一套可以支持异构存储的管理软件,比如IBM TPC ,HP SE,EMC ECC等等,不过管理软件还是对自家存储支持好,第三方的支持一定要仔细确认一下。...
看到有人采用SNMPtrap方式。我采用的方法是python脚本,通过paramiko模块使用SSH连接到v7k,再运行CLI命令获取到存储相关信息。
Zabbix监控系统简洁的Web配置界面,配置简单,适用于复杂的环境,丰富的数据收集机制,灵活的阈值定义,高度可配置化的告警,实时图表绘制,丰富的可视化选项,而且支持二次开发
1.虚拟化异构等技术确实实现了多产品的统一管理分配部署问题,但是问题排查还是比较困难。2.比如一个异构LUN有io错误,还是需要判断是上层异构设备的问题,比如链路错误;还是底层存储的问题,磁盘介质错误或者是其他异常。3.因此在管理时还是需要虚拟化设备和底层存储统一监控管...