银行数据迁移分布式存储存储io

如何有效和智能的控制并恢复IO，减少因IO问题导致数据批量计算的影响，是分布式存储考虑和解决的问题？

金融场景具有高密集IO的特性，尤其在数据批量计算方面，分布式存储在频繁数据分布和迁移过程中通常会带来IO争抢的问题，在大规模集群遇到扩容或硬盘替换时尤为明显，给分布式存储在金融领域的深入使用带来了一定的风险。如何有效和智能的控制并恢复IO，减少因IO问题导致数据批量计...显示全部

关注5

参与10

查看其它 2 个回答顾黄亮的回答

顾黄亮

技术总监畅销书作者

从分布式存储在金融领域的实际使用过程中，不定期会有常规的运维操作，比如题主所提到的大规模集群的扩容和磁盘更换，IO争抢也是较为常见的问题之一。
抛砖引玉，笔者所遇到的大规模集群中，单个集群超过1K的存储节点，按照正常的概率，每个月会有数量不等的磁盘损坏，每个季度会存在一次集中换盘，这些操作都会通过数据迁移、数据负载和数据平衡的方式进行数据恢复，IO争抢大都发生在这个场景，高密集IO计算的争抢更多的取决于数据分布算法的合理性。
通常情况下，抛开分布式存储自身的算法，更多的采取时间策略+流量策略的方式规避IO争抢，比如在业务高峰期避开磁盘变更窗口，而流量策略更多的是基于数据流量恢复速率阈值匹配业务场景，最终实现在不影响业务IO的情况下，快速完成数据迁移恢复。

银行 · 2021-05-19

查看赞同的人

如何有效和智能的控制并恢复IO，减少因IO问题导致数据批量计算的影响，是分布式存储考虑和解决的问题？

查看其它 2 个回答顾黄亮的回答

回答者

顾黄亮最近回答过的问题

回答状态

如何有效和智能的控制并恢复IO，减少因IO问题导致数据批量计算的影响，是分布式存储考虑和解决的问题？

查看其它 2 个回答顾黄亮的回答

回答者

顾黄亮 最近回答过的问题

回答状态

顾黄亮最近回答过的问题