用IBM WebSphere DataStage进行数据整合,共三部分
正在加载中...
第一部分:
数据整合的核心内容是从数据源中抽取数据,然后对这些数据进行转化,最终加载的目标数据库或者数据仓库中去,这也就是我们通常所说的 ETL 过程。IBM WebSphere DataStage 为整个 ETL 过程提供了一个图形化的开发环境。
传统的数据整合方式需要大量的手工编码,而采用 IBM WebSphere DataStage 进行数据整合可以大大的减少手工编码的数量,而且更加容易维护。数据整合的核心内容是从数据源中抽取数据,然后对这些数据进行转化,最终加载的目标数据库或者数据仓库中去,这也就是我们通常所说的ETL过程。IBM WebSphere DataStage 为整个 ETL 过程提供了一个图形化的开发环境。本文将从以下几个方面来介绍 IBMWebSphere DataStage:
1. 数据源连接能力
2. 完备的开发环境
3. ETL Job 的并行执行能力
4. 开发一个简单的 ETL Job
第二部分:
本文介绍了IBM Websphere DataStage 中 Job Senquence 和 Container的用法,然后用一个ETL Job演示了IBM WebSphere DataStage 处理多数据源方面的优势。
第三部分:
引入 RTI Job 的概念,并详细讲述如何利用DataStage 开发 RTI Job 并将 RTI Job发布成 Web Service 以供其他应用程序调用。
本文主要包含以下几部分内容:
1. RTI Job特性介绍
2. 开发一个RTI Job
3. 将RTI Job发布成WebService
4. 利用Java客户端调用发布好的Web Service