迄今为止,DB2 BLU最为详尽的一份说明文档

本资料无预览

如感兴趣请 1 金币购买后下载

立即下载

资料简介:
我们知道,传统 Cognos BI 使用 Power Cube, 一种 MOLAP 技术 , 将 RDBMS 数据装载到 Power Cube 中,并进行事先数据计算、数据汇总,因此,查询效率高;但也带来一些问题,当数据量达到上百 GB 时,Cube 数据急速膨胀,造成数据装载、计算时间长,增量数据刷新速度慢,甚至有时计算不出来;另外,需要复杂的维护工作,不能实现实时数据分析,不能查询细节数据;为解决上述问题,Cognos BI 会使用 Dimensionally Modeled Relational (DMR) 方式,采用 ROLAP 方式实现多维建模及分析,可以很好解决查询细节数据、实时、动态查询最新数据,但也会造成性能问题,采用 DMR 方式,多采用星型模型,查询时会有多表连接操作,特别是,每一个查询,都要将多维查询装换成 SQL,效率有时不是很高,为解决这个问题,Cognos 10.1.1 提出了 DQM (Dynamic Query Mode) 运行模式,针对 DMR 多维模型,支持多维查询的数据缓冲机制,通过 DQM,可以支持包含维度数据的成员缓冲及包含度量值的数据缓冲,这样,大部分相似的查询请求都可以通过本地缓存数据得到满足,只有数据不在缓存中的查询才需要到数据库中执行,显著提高了查询效率。从 Cognos 12 开始,Cognos 又推出了动态 Cube(Dynamic Cubes)技术,它更进一步扩展了动态查询功能,提供了增强的内存加速技术,支持成员缓存、数据缓存、表达式缓存、聚合缓存及执行结果缓存方式,更进一步提高了多维查询的效率。

为了更进一步提高数据集市的查询效率,减少数据集市维护的复杂度,同时节省数据存储成本,IBM 于2013年 4 月份推出了 DB2 10.5 with BLU Acceleration,它采用动态 in-memory 技术,没有了传统纯内存系统的成本和局限,成就了思考速度的分析。它通过结合 in-memory 和列存储检索,最大化的 CPU 处理,还有能支持快速输入输出的数据忽略(Data Skipping,“跳过”大量不需要的数据,挑出重要的“小数据”) 等技术,极大加速了智能分析和报表功能。

通过使用 DB2 with BLU Acceleration,不仅可以对 Cognos BI 关系查询进行加速,对 Cognos 最新的动态 Cubes(Dynamic Cube)技术可以做到更好的支持,提高其查询的效率。Cognos 最新的动态 Cubes(Dynamic Cube)技术,利用 DB2 with BLU Acceleration 的能力提供大数据量下的多维分析技术,作为 PowerPlay 的替代方案,尤其适合需要“快速响应”的数据集市类场景。

通过对 Cognos BI 和 DB2 with BLU Acceleration 内部测试,测试场景是采用 Cognos 动态多维数据集 (Dynamic Cubes),并利用成员、数据、表达式、聚合及结果的内存缓存来扩展动态查询性能,原始数据 963GB,包含 7 个事实表及 17 个维度表,从测试结果,我们可以看到,针对即席 Cognos 报告 , 采用 DB2 with BLU Acceleration,比采用 DB2 10.1 要快 14 倍,内存中动态 Cube 缓存加载、聚合速度可以提高 18 倍,数据空间节省 20 倍左右,而且不需要创建索引、汇总表,不需要调优,不需要改变 SQL 语句,使用十分方便。

由此可见,使用 DB2 with BLU Acceleration 及 Cognos BI 可以显著提升数据分析的效率,加速实现业务洞察力。

本文,我们会通过一个具体示例,详细介绍如何综合使用 DB2 with BLU Acceleration 及 Cognos BI 来加速实现业务洞察力,希望能够对 Cognos BI 的读者有所帮助, 并可以非常快速地优化现有查询、分析的效率,并简化数据集市维护工作量,同时,也可以进一步减少数据存储成本。

环境准备

本次实验环境,我们采用 SUSE Linux Enterprise 11 64-bit,并且在上面安装了如下的软件:
DB2 Advanced Enterprise Server Edition 10.5
IBM Cognos BI Server 10.2
Apache HTTP Server 2.0
在 windows 7 客户机上安装了如下的软件:
IBM Cognos Framework Manager 10.2

采用 DB2 with BLU Acceleration 创建数据集市

DB2 with BLU Acceleration 是 DB2 10.5 版本推出的专门用于分析查询的新技术,它采用列式存储技术,并采用 Huffman、Offset Coding 等压缩算法对数据进行压缩,基本可以节省 10-20 倍存储空间;它在 DB2 内核中引入了独特的新运行时技术,采用 SIMD(Simple Instruction Multiple Data)技术充分发挥 CPU 架构优势,进一步提高查询的性能,并针对内存、CPU 及 I/O 进行了优化,可以显著改善数据集市存储、查询性能、易用性和实现价值的速度。如下图所示,DB2 with BLU Acceleration 完全集成在 DB2 内核中,可以和传统的行式存储共存,甚至可以在同一个 SQL 语句中同时访问行式存储及列式存储数据,他们使用相同的 DB2 的处理模型、DB2 缓冲池管理、存储管理及各种工具,使用相同的 SQL 语法、编程接口(JDBC/ODBC)及管理命令,因此,从用户使用的角度来讲,和传统的 DB2 管理完全相同,不需要增加学习的成本。

详细文档:
2014-09-09
浏览2855
下载37

已下载用户的评价7.73分

您还未下载该资料,不能发表评价;
查看我的 待评价资源
zymh_zyzymh_zyIT顾问国内某公司2020-02-11
有用
有用,学习DB2之余,顺便学习了cognos.

贡献者

hotmail软件开发工程师,hotmail
没有
X社区推广