Linux 下的 DataX 数据同步脚本,蛮适合用来搞定两台能互通服务器之间的数据库表同步。文件名叫aaa.json,配置简单明了,调试起来也方便,不用太折腾。

DataX是阿里开源的离线数据同步工具,支持多种数据源对接,MySQL、Oracle、PostgreSQL 你都能用上。这个脚本的思路也比较清晰,就是把源库和目标库的连接信息写好,再列出要同步的表就行。

用过你就知道,它适合那种“我不想写代码,但又想批量搬数据”的场景。比如你在搞数据库迁移,或者多个环境要保持表数据一致,就合适。配置项里像jdbcUrlusernamepassword这些都常见,DataX 自己传输逻辑,嗯……挺省心。

同步执行一般用python datax.py aaa.json这种命令就能跑。如果你想跑批任务,配个 crontab 也挺方便。哦对了,表结构得一致,不然跑起来报错你会抓狂。

想深入点的,可以看看DataX JSON 范例这篇文章,讲得还挺细的。要是你用的是 PostgreSQL,这个增强版支持数组类型也不错。

,如果你正好在搞数据库同步,又想图个省事,这个脚本还蛮适合拿来改一改就能用。如果你是新手,建议先手动跑几次看看效果,再考虑接入定时任务。