数据仓库的演变历程

正在加载中...

试读已结束

继续阅读请 1 金币购买后下载

立即下载

资料简介:
史上最好的介绍数据仓库演变历程的资料(各种图解分析的插入,更加令人了解数据仓库的变化过程)
信息系统领域是一个“不成熟”的领域。 “不成熟”这个词通常具有消极的含义,因而公开使用这个词不得不多加小心。但是从历史的观点来看的确如此。如果我们将信息处理的历史与其他技术领域的历史进行比较的话,就没有争议了。我们知道古埃及的象形文字主要是当时的帐房先生用来表示所欠法老谷子的多少。当漫步在罗马市区,我们就置身于两千多年前土木工程师所设计的街道与建筑物之间。同样,许多其他的领域也可追溯到远古时代。因为信息处理领域只是从 6 0年代初期才出现的,所以,历史地来看,信息处理领域是不成熟的。
信息处理领域的年轻性表现之一就是其倾向于面面俱到。有这样一种说法,如果细节都正确了,那么我们就可以坐享其成。这就好象是说,若我们知道如何铺水泥、如何钻孔、如何安装螺母与螺栓,就不必操心桥梁的外型与用途了。如此态度会驱使一个成熟的土木工程师发疯的。
数据仓库的历史是伴随某种发展过程开始的,在此发展过程中,业界中人士所考虑的是投入更大的力量。更大规模的体系结构正在被勾勒出来—在这种体系结构中数据仓库处于中心地位。最好从一种广阔的视角去观察这个体系结构,而不是从某种细节去认识。有趣的是,决策支持系统 ( D S S )处理是一个漫长而复杂的演化进程的结果,而且它仍在继续演化。D S S处理的起源可以追溯到计算机发展的初期。
图1 - 1表明了从 2 0世纪6 0年代初期直到 1 9 8 0年的D S S处理的演化进程。在 6 0年代初期,创建运行于主文件上的单个应用是计算领域的主要工作。这些应用的特点表现在报表和程序,常用的是 C O B O L语言。穿孔卡是当时常用的介质。主文件存放在磁带文件上。磁带适合于廉价地存放大容量数据,但缺点是需要顺序地访问。事实上,我们常说,在磁带文件的一次操作中, 1 0 0 % 的记录都要被访问到,但是只有 5 %或更少的记录是真正需要的。此外,访问整条磁带的文件可能要花去 2 0 ~ 3 0分钟时间,这取决于文件上是什么数据及当前正在做什么处理。
大约在 6 0年代中期,主文件和磁带的使用量迅速膨胀。很快,处处都是主文件。随着主文件数量的增长,出现大量冗余数据。主文件的迅速增长和数据的巨大冗余引出了一些严重
问题:
■ 需要在更新数据时保持数据的一致性。
■ 程序维护的复杂性。
■ 开发新程序的复杂性。
■ 支持所有主文件需要的硬件数量。
简言之,属于介质本身固有缺陷的主文件的问题成为发展的障碍。如果仍然只用磁带作为存储数据的唯一介质,那么难以想象现在的信息处理领域会是什么样子。

222.jpg


2014-09-15
页数229
浏览2464
下载1

已下载用户的评价7.09分

您还未下载该资料,不能发表评价;
查看我的 待评价资源
本资料还没有评价。

贡献者

leeping软件开发工程师,leeping
X社区推广