黑白分明的章节结构、案例驱动的方式,Spark的原理和实战讲得都挺明白。

书里从Hadoop讲起,帮你理清从 MapReduce 到 Spark 的演变过程,算是做了个比较扎实的铺垫。适合对大数据框架有点基础、但还没搞清底层原理的你。

实战部分也挺接地气,Spark ShellScala 插件、还有如何看 Spark Web UI 都有写,跟着做一遍,环境就能跑起来,蛮省心。

RDD DAG构建和 Task 调度这块解释得也不啰嗦,用图加例子,一看就懂。嗯,如果你对 Spark 内部机制比较好奇,这几章别跳过。

另外推荐几个关联文章,像Spark 与 Hadoop 大数据开发指南这种,跟这本书搭配看,理解会更全面。

如果你最近在搞毕业设计,像Spark 自动调优机制研究这种专题内容,也值得一看,思路能打开不少。