目录清晰的《Hadoop 权威指南第 3 版》中文电子书,挺适合刚上手或者准备进阶的你。书里讲了不少实际案例,像怎么用 MapReduce 批的问题,讲得还挺接地气的。

新版的 MapReduce API 也有说,顺带把 YARN 的新架构也讲了。嗯,YARN 就是那个更灵活的资源调度框架,以前你要写 MapReduce,现在可以更自由地跑别的计算框架了,像 Spark、Tez 之类的。

书里有些代码还挺实用的,比如自定义 Partitioner 的写法。你可以看看这篇API 操作与 Partitioner 重写,配合阅读效果更好。

如果你在搭 CDH 环境,配合CDH 搭建指南一起看也挺顺手的,路径、配置啥的都对应得上。

,这书内容比较全,入门用够,进阶也撑得住。如果你想搞懂 YARN 怎么回事、MapReduce API 怎么变的,拿它当主教材还挺合适的。