https://github.com/alibaba/DataX/wiki/DataX-all-data-channels
这个是Datax的官网可以看一下
我简单介绍一下,datax支持从oracle mysql,postgresql,hdfs等相互之间同步,他只需要你配置一个json文件,这个json文件的格式就是在我刚刚发的url中,最后利用datax的框架执行一个python 命令就能把数据给同步了,为啥要介绍他呢不建议使用sqoop呢,一个是sqoop比较笨重其实说白了他就是jdbc进行读写,但是datax中间有个环形缓存多进程模式,这样确保了数据同步的效率
收起