HDFS 的命令操作挺多的,一开始看有点懵,其实熟悉几条常用的就够用了。像catputget这些命令,操作思路跟 Linux 像,上手快。权限相关的chownchmod也比较常见,文件批量管理的时候用着顺手。

HDFS 的路径结构用 URI 来写,hdfs://namenode:port/path这种格式,其实就是在远程上操作目录和文件。你要是部署在集群里,多个节点同步访问数据,效率还是蛮高的。

文件从本地拷到 HDFS 用copyFromLocal,反过来就用copyToLocal,也可以用get命令,区别不大。注意一下目标路径和权限就行,出错多半是这块。

平时清理空间,记得跑下expunge命令,能把 HDFS 的回收站清掉,不然你以为删掉了,其实空间还占着。

还有个小建议:用-R参数要小心点,权限改错了影响一堆目录。可以先在小目录试一下,确认无误再放大操作。

命令不难记,多用几次就熟了。如果你是刚接触 Hadoop 或者 HDFS,建议先把这些基本命令撸一遍,搭环境、跑项目都方便不少。