DB2 Warehouse V10.5 构建列存储数据仓库最佳实践

本资料无预览

如感兴趣请 1 金币购买后下载

立即下载

资料简介:
概述

在 DB2 V10.5 之前,DB2 在物理实现上一直是基于行存储,但在典型的数据仓库应用中,由于读操作的频率(查询、连接、聚集等)会远大于写操作(增删改),这种存储实现方式并不能给数据仓库、实时分析带来显著的优势。

近些年来列存储数据库以其读磁盘效率,存储空间的可压缩比率,排序 / 索引效率,以及由此带来的技术、管理和应用优势,成为了数据仓库应用的一大热点。

DB2 V10.5 正是在这一背景下应运而生,这也使得构建基于列存储的数据仓库成为可能。这篇文章将介绍使用 DB2 Warehouse V10.5 时,构建列存储数据仓库的一系列最佳实践,并且穿插阐述了数据仓库数据流设计时的一些细节处理。

准备活动

为了演示后续的用户场景,首先我们在 DB2 V10.5 上创建名为 BLUTEST 的数据库,并分别建立两个行存储,两个列存储的表:

清单 1. preparation ddl

人人人人人人.jpg

建完之后,为了在 Design Studio 中使用这个数据库,需要将其反向工程为本地的数据模型文件(.dbm 文件)。具体步骤此处省略。


场景一:将文件内容装载至列存储表

在很多数据仓库的应用场景下,中间数据(例如从 OLTP 数据中转换并导出)会以文件形式保存,然后再将其直接导入数据仓库表中。此场景将介绍如何将文件内容装载至列存储表。

首先创建一个数据流,并拖拽“文件源”操作符至数据流编辑器中,其中抽取方法有三种选项:

1.
使用 DB2 LOAD 实用程序从文件抽取数据

2.
使用 DB2 IMPORT 实用程序从文件抽取数据

3.
使用 DB2 INGEST 实用程序从文件抽取数据

这三种方式均能正确将文件内容装载至列存储表,这里我们采取默认的 DB2 LOAD 方式。

接着指定该文件在客户机的位置。(注意:若选择“数据库服务器”选项,则意味着文件需存在于此数据流的 SQL 执行数据库上)


2014-08-13
浏览10979
下载8

已下载用户的评价7.33分

您还未下载该资料,不能发表评价;
查看我的 待评价资源
本资料还没有评价。

贡献者

sunnys软件开发工程师,国美
X社区推广