HDFS 的读原理图,挺适合拿来理解Hadoop文件是怎么被一个块一个块读取的。图里分得清客户端求、NameNode分配、DataNode响应这几个步骤,Socket 通信这块也画得比较清楚,思路挺顺。适合你刚接触 HDFS 或者想搞清它底层是怎么运作的。配合下面几篇文章看,理解会更透彻一些,尤其是那个关于数据块存储机制的,讲得还挺细。