HDFS 的常用指令文档,蛮适合新手快速上手的。整理得比较清晰,像是hdfs dfs -ls
、put
、get
这些基本操作都有覆盖。响应也快,出错提示也明确,比较适合在终端里来回折腾的时候查一眼。
HDFS 的分布式文件系统,结构上其实不难理解,核心就是 NameNode+DataNode 的玩法。你只要搞懂文件怎么切块、怎么复制,剩下的命令操作就顺了。
像我平时常用的几个命令:hdfs dfs -copyFromLocal
上传文件,hdfs dfs -get
拉文件,还有hdfs dfs -du
看空间占用,基本覆盖大多数需求。
对了,如果你也想搞懂它背后的设计原理,可以顺便看看这几篇文章:
如果你在搭建集群或者跑大数据任务,早点熟起来 HDFS 的指令,能省不少事。