一、什么是ETL
ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
二、Kettle简单说明
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。
三、需求
1、 Mysql 5.X数据迁移到 DB2 8.X
2、 主键自增改成32位UUID
三、准备工作
1、 源数据库:Mysql 5.6
2、 目标数据库:DB2 8.X
3、 数据迁移工具:Kettle6.0.0.0-353
四、实战开始
1、说明一下省略掉的步骤
在开始使用Kettle前,我使用了PowerDesigner18.6建立数据模型,然后导出对应数据库的建表脚本,这里我导出了DB2 8.X的建表脚本,然后首先在DB2中将目标表建立好。其实在Kettle中也可以在执行过程中来建立表,我也是初学Kettle,所以选择了一种相对简单的方式来操作,毕竟关注重点在于数据迁移这方面上。
2、安装JDK
因为Kettle是纯JAVA写的,所以依赖JDK,至于JDK的安装不是本文的重点,请读者自行百度完成。
3、 安装Kettle
下载pdi-ce-6.0.0.0-353.zip,我已经上传至百度云,下载地址:http://pan.baidu.com/s/1jGjMoXw
Kettle是绿色免安装的,将下载的压缩文件解压,找到程序启动文件Spoon.bat(Linux的Spoon.sh),双击则可以启动。不过在这一步操作之前,还有重要的一步需要做,就是拷贝我们的数据库驱动JAR包到指定目录。我是windows 7 x64,所以我将mysql和DB2对应的驱动包拷贝到了data-integrationlibswtwin64目录下,因为拷贝进去之后,需要重启程序才能生效,所以建议解压后,首先拷贝驱动JAR包到指定目录。
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞0
添加新评论0 条评论