hadoop 基础的入门 PPT,内容挺扎实,讲得比较系统,尤其适合对大数据还没什么概念的同学。像 HDFS、MapReduce 这些核心点都有覆盖,举的例子也比较通俗,拿来过一遍思路会清晰不少。
数据的流程图、Hadoop 架构图这些图解有用,建议你边看边画下来,理解更快。嗯,讲到 MapReduce 的时候也有带点代码示例,map()
和reduce()
两个函数是重点,别只看不敲。
刚接触大数据生态圈的,建议你可以配合着看看下面这些资源,比如:spark和Cloudera的入门指南,思路跟 Hadoop 蛮像,但细节有差,了解一下挺有。
如果你是数据库方向转过来的,也可以顺手看看MySQL 教程或Redis 入门,了解下传统存储和分布式存储的区别,思路就更清楚了。