1、面对分布式存储设备数量规模逐渐增长,面对数量庞大的集群,设备故障的概率也在增大,面对几乎每日都有出现的设备故障,对运维来说也是一个挑战,几乎每日都要处理相关的设备故障;
2、容量管理,对于整体存储而言,容量管理对运维来说是事先要规划好的的容量横线,当超过横线后通过扩容或删除数据等方式确保容量的饱和度;
3、监控,分布式存储告警与行内统一监控系统对接,底层设备监控做到监控全覆盖,实现告警及时推送,及时告知,及时处理;
4、备份,对于分布式存储重要数据,特别是平台侧数据或重要业务的数据,备份也是需要的,通过跨中心灾备的形式确保数据的跨中心同步复制。