HDFS 的常用指令文档,蛮适合新手快速上手的。整理得比较清晰,像是hdfs dfs -lsputget这些基本操作都有覆盖。响应也快,出错提示也明确,比较适合在终端里来回折腾的时候查一眼。

HDFS 的分布式文件系统,结构上其实不难理解,核心就是 NameNode+DataNode 的玩法。你只要搞懂文件怎么切块、怎么复制,剩下的命令操作就顺了。

像我平时常用的几个命令:hdfs dfs -copyFromLocal上传文件,hdfs dfs -get拉文件,还有hdfs dfs -du看空间占用,基本覆盖大多数需求。

对了,如果你也想搞懂它背后的设计原理,可以顺便看看这几篇文章:

如果你在搭建集群或者跑大数据任务,早点熟起来 HDFS 的指令,能省不少事。