信息可以划分为两大类:一是能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号。而另一类是无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。
随着网络技术的发展,特别是Internet和Intranet技术的飞快发展,使得非结构化数据的数量日趋增大。
1) 影音图像:后市场主要针对终端用户,零散数据较多,经过分析,图片和音视频的数据量最大。非结构化数据存储的特质,就是解决非结构数据碎片化、不规则,导致I/O低下的问题。
2) 文本网页:文本及网页的数据也是非结构化数据存储的对象。