Sqoop1 的常用命令和细节都在这份文档里整理得挺全的,尤其是像sqoop import
、sqoop export
这些常见命令,不仅语法写得清楚,还搭配了使用场景。像你要从 MySQL 批量把数据导到 Hive 里,用--hive-table
也能一步搞定,挺方便的。
命令参数讲得比较细,比如--num-mappers
并行、--check-column
搞增量导入,还有控制大对象用的--blob-as-string
这些都写到了。对刚接触 Sqoop 的朋友来说,直接照着改参数就能跑。
我觉得它蛮适合放到书签里的,临时查命令或者忘了某个选项怎么写,翻一下就能找到。内容不啰嗦,示例调用也到位,比如那句:
sqoop import --connect jdbc:mysql://localhost/test
--username root --password test
--table customers --num-mappers 4
另外,它还有提到一些特定数据库的注意事项,比如 MySQL 里的zeroDateTimeBehavior
,PostgreSQL 的视图导入支持,算是加分项。
如果你平时在用 Hadoop 数据,或者要和 Hive/HBase 打交道,这份文档蛮值得收藏一下的。用着顺手,查着也快。