相对于传统存储,对象存储的海量非结构化数据的读取(索引)效率更高。
对象存储的读取方式,首先每个对象在完全平展的一个平面上,不存在文件级、目录树的概念,所有多项都在一个层级,其次对象存储的访问是通过唯一的Object ID来完成访问的,而这个ID是一个由系统定义,可设置位数的,字母大小写加上数字的字符串。一个16位的字符串即为(26+26+10)的16次方,已经足够涵盖所有的数据了。由于对象存储是采用RESTful API的方式访问,即HTTP的通信协议,因此需要访问一个对象的时候只需要主机IP+域名+对象ID即可,如https://hostIP/namespace/AABBCCDD。
传统存储是块/文件的读取方式,是通过目录树的方式,每一个文件需要有元数据去存储一个很长的字符串作为这个文件访问的路径,在文件系统访问方式下,首先,这样的路径长度是有限制的,这是由CIFS或NFS的文件系统所限制的;其次,如果要构建索引的话,需要深入到每一个细小的文件数末梢,当文件数量巨量时,实际上这种索引是无法构建的。
收起