快速上手的,内容挺精炼的,适合刚入门的大数据朋友。开头就讲了下Big Data是怎么回事,带你过一遍MapReduceHDFS的基本概念,结构清楚,不绕弯子。

方式偏实用,比如你看到MapReduce时,不光有原理解释,还有代码例子,像map()reduce()函数咋用,怎么做分区都讲了。嗯,对于初学者来说,看完就能动手试试。

HDFS部分也不错,说了怎么把文件存到分布式系统里,比如用hdfs dfs -put上传数据,响应也快。你要是做日志、用户行为追踪这些,基本逃不出这套系统。

你要是想再深入一点,下面几个链接也蛮值得一看:

比如,Big Data Ecosystem Hadoop and Key Components讲了整套生态;Hadoop 框架解析能让你更好理解 Hive 和 HBase 的用法;还有个API 操作示例直接上手。

如果你对Solr结合Hadoop感兴趣,可以看下Scaling Big Data with Hadoop and Solr这本书。嗯,还有一本Practical Big Data Analytics,案例挺多,实操性强。

,如果你刚准备摸大数据这块,或者想理清楚 Hadoop 这条线,这份英文教程还挺靠谱。建议一边看一边敲代码,效果更好~