公司数据仓库项目做重大迁移,欢迎推荐在数据仓库项目上应用成熟的开源ETL工具?

公司的数据仓库项目做重大迁移,db2彻底退服,上Oracle exadata,配置库变mysql(单机pcserver)。由于数据仓库项目的稳定性,公司开发决定放弃10年前的ETL工具,不再升级并支持新功能。数据仓库的ETL工具主要实现的数据装载(支持多种关系型数据库,校验、清洗、文件压缩等)、数据抽取(...显示全部

公司的数据仓库项目做重大迁移,db2彻底退服,上Oracle exadata,配置库变mysql(单机pcserver)。由于数据仓库项目的稳定性,公司开发决定放弃10年前的ETL工具,不再升级并支持新功能。
数据仓库的ETL工具主要实现的数据装载(支持多种关系型数据库,校验、清洗、文件压缩等)、数据抽取(支持多种关系型数据库)、数据传送(支持各种协议)。
因为以前都用的公司自己的etl工具,所以对其他产品都没什么了解,只很浅的应用过Kettle,从自己查找的资料上来看,etl工具的性能,易用性,稳定性差距还是很大的。都有哪些在数据仓库项目上应用的开源成熟ETL工具?我看很多都是基于java的,也有Ruby和Go的(不过好像都是在大数据上应用),py现在很流行,有py的吗?数据仓库和大数据项目现在都数据交换频繁,有ETL工具是兼容两者的吗?
请各位大佬指点。

收起
参与14

查看其它 2 个回答BI程序者的回答

BI程序者BI程序者项目经理中华联合

个人比较推荐kettle,主要kettle也支持集群。

另外hadoop平台的mapreduce也可以作为ETL工具使用。

保险 · 2019-05-28
浏览4413

回答者

BI程序者
项目经理中华联合
擅长领域: 数据库大数据商业智能

BI程序者 最近回答过的问题

回答状态

  • 发布时间:2019-05-28
  • 关注会员:5 人
  • 回答浏览:4413
  • X社区推广