DataX是阿里巴巴开源的一款数据同步工具,支持多种数据源和目的地,包括MySQL、HBase、HDFS等。本文将介绍如何使用DataX将MySQL数据库中的数据同步到另一个MySQL数据库。
首先,我们需要安装DataX。可以从官网下载:https://github.com/alibaba/DataX。安装完毕后,在终端或命令行窗口输入以下命令启动DataX:
python bin/datax.py
接下来,我们需要创建一个job.json文件,用于配置数据同步任务。以下是一个简单的示例:
{"job":{"setting":{"speed":{"channel": 1}},"content":[{"reader":{"name":"mysqlreader","parameter":{"username":"root","password":"password","column":["id","name","age"],"splitPk":"id","connection":[{"table":["user"],"jdbcUrl":["jdbc:mysql://localhost:3306/testdb?useSSL=false&useUnicode=true&characterEncoding=utf8"]}]}},"writer":{"name":"mysqlwriter","parameter":{"username":"root","password":"password","writeMode":"insert","column":["id","name","age"],"connection":[{"table":"user","jdbcUrl":"jdbc:mysql://localhost:3306/targetdb?useSSL=false&useUnicode=true&characterEncoding=utf8"}]}}}]}}
上面的配置文件定义了一个数据同步任务,将源数据库中的user表中的id、name、age字段的数据同步到目的地数据库的user表中。接下来,我们运行以下命令开始同步:
python bin/datax.py job.json
至此,DataX的MySQL到MySQL数据同步就完成了。如果想要更详细的配置,可以参考DataX官方文档。