Sqoop1 的常用命令和细节都在这份文档里整理得挺全的,尤其是像sqoop importsqoop export这些常见命令,不仅语法写得清楚,还搭配了使用场景。像你要从 MySQL 批量把数据导到 Hive 里,用--hive-table也能一步搞定,挺方便的。

命令参数讲得比较细,比如--num-mappers并行、--check-column搞增量导入,还有控制大对象用的--blob-as-string这些都写到了。对刚接触 Sqoop 的朋友来说,直接照着改参数就能跑。

我觉得它蛮适合放到书签里的,临时查命令或者忘了某个选项怎么写,翻一下就能找到。内容不啰嗦,示例调用也到位,比如那句:

sqoop import --connect jdbc:mysql://localhost/test 
  --username root --password test 
  --table customers --num-mappers 4

另外,它还有提到一些特定数据库的注意事项,比如 MySQL 里的zeroDateTimeBehavior,PostgreSQL 的视图导入支持,算是加分项。

如果你平时在用 Hadoop 数据,或者要和 Hive/HBase 打交道,这份文档蛮值得收藏一下的。用着顺手,查着也快。