在一个PPT里看到过,传统的RAID 6要达到1PB的可用容量,需要900块4TB的磁盘,裸容量高达3.6PB,而Cleversafe只需要423块盘1.7PB裸容量,Cleversafe是如何做到的?
收起在讲可用可靠性之前,现在说说纠删码的技术,为什么就允许有节点失效呢?纠删码的技术实际上60年代就已经在使用了,是通过算法的方式来避免做副本,从而保证我数据本身比较少的容易但是也具备非常高的可用性。
简单举个例子加入Cleversafe的IDA是2/3,意味着我可以丢掉一个切片,数据依然可读,那么实际通过纠删码运算过之后的公式为(a和b为实际原数据):
5a+3b = 切片1
8a-7b = 切片2
2a+10b = 切片3
每个切片本身的值是可得的,因此,根据我们数学的求解公式,需要n个公式来求解n个未知数。因此,我只需要两个切片即可反算我原数据ab的值,从而获得我原对象文件。
2/3只是一个帮助理解的最小例子,其他专家举例的7/12也是类似的原理。而Cleversafe是业界唯一一家厂商可以配置此纠删码,因此,在经济性和可用可靠性,可以根据客户的实际情况来定制了。
可用可靠性:结合前面说的纠删码,如果我的切片数是12,而原数据是7,因此,我可以允许有5片切片数据丢失,因而12节点宽度的部署,三站点模式,每站点4节点,因此,这样的一套系统天生就具备了容灾特性,从而不需要做副本,同步,备份等。