手动整理的《Hadoop 技术内幕》三册目录,挺适合做知识回顾或者框架梳理用。每册都拆解得蛮细,像 HDFS、MapReduce、YARN 都有独立一本。目录不是那种简单罗列章节的,写得还挺用心,有条理,方便你快速定位重点内容。

HDFS 那本主要讲了文件存储的底层逻辑,比如NameNode怎么管理元数据、块数据如何复制,适合搞架构或维护的大佬;MapReduce那本偏流程,JobTrackerTaskTracker都说清楚了,哪怕你写过不少任务,回头看看还是会有收获;YARN那本呢,更适合搞资源调度或多任务平台的同学。

顺带推荐几个相关文章,跟书的内容能对上:

看看这些实战文章,再回头翻书,理解会更快一些。

小建议:如果你是准备写调度框架,或者对大数据底层逻辑感兴趣,可以把这三本书的目录拷下来做个导航页,用markdown整理下也挺方便,查资料效率直接提升一截。