《Hadoop 权威指南》的内容挺扎实,覆盖面也蛮广的,适合你系统梳理一下 Hadoop 的底层原理和生态工具。像HDFS、MapReduce、Hive这些核心概念,它都讲得比较透。
Hadoop 的架构就是主从模式,NameNode和DataNode配合跑,一边管文件目录,一边管数据块。任务提交以后怎么切块、怎么调度执行,它的链路讲得清晰。
我觉得它有意思的地方是,不只是教你怎么用,还讲了为什么这么设计,挺适合那种喜欢刨根问底的你去看。尤其对大数据批感兴趣的朋友,这书可以当操作手册来用。
哦对了,Hive、Pig、HBase这些生态工具也讲了不少。举个例子,如果你在做日志或者推荐系统,MapReduce配合HDFS就挺香的,效率也不差。想跑实时任务?可以看看里面对Spark的,思路会开阔不少。
,它也不避短,像延迟、一致性这些痛点它也点得实在。适合那种不止想会用,还想搞明白 Hadoop 背后逻辑的你。
如果你平时喜欢翻 API 或者折腾下配置,《Hadoop 权威指南》可以放书架上常备。想深挖某个点?这几个链接你可以先点进去看看: