你说的是etl技术,ETL早年是有标准工具的,比如著名的Kettle、datastage都是,但Kettle是开源的,Datastage是收费的,现在我们公司还有用datastage从oracle中抽取数据呢?
但近些年来,ETL的工具就多了去了,特别对非结构化数据仓库hive,生态中是使用sqoop进行数据抽取。还有很多干脆,自己写python来抽取。Oracle的标准化产品中,也有Oracle etl for hadoop(具体名字忘了),阿里云上还有datax抽取 ( 阿里很长时间不更新了)。
收起