分布式存储本来就具有数据冗余和修复功能。如果在单个节点上做RAID,当出现故障的时候,你可能要离线rebuild RAID。但不做RAID的话,换个硬盘就自动在线恢复了,业务完全不中断。
收起ceph 和 raid 不建议混合使用。
分布式存储已经做到了多副本的安全冗余机制。乃至1-6副本。ceph已经解决了数据冗余的问题。不需要在做raid,做raid后反而增加了运维难度,若raid 在出现问题时,数据做重平衡过程中也会影响ceph 存储集群
可以说,绝大多数分布式存储都不建议使用raid, 不只是ceph不建议, hdfs什么的一样
首先,你要明白raid是干嘛的?冗余,是一种以高可用为目的的设计。而的分布式存储,都是具备有自我冗余功能,就拿你说的ceph来说,两种冗余方式可以选择:纠错码、副本。
第二,raid会影响整体的IO吞吐,成为IO的瓶颈,尤其是在使用高端SSD时尤为明显。一般在多块SSD服务器上,甚至要使用2块的raid卡。
第三,和上面大多数人说的类似,多了一层raid,在运维上还更麻烦,
第四,出于成本考虑,省盘.....
个人理解,如有错误还望留言指正
收起