Hadoop 的入门知识点和发展史,算是新手上路的必修课了。讲得比较通俗,适合你刚接触大数据的时候翻一翻,像看地图一样,一下就知道该往哪儿走。
Hadoop 的核心概念讲得还挺清楚,从MapReduce
到HDFS
,都有提到,没啥废话。尤其是分布式存储那块,解释得比较贴地气,理解起来不费劲。
发展历程部分挺有意思的,从最早的 Nutch 项目聊起,到 Yahoo 接手,Apache 孵化出来整个生态,像看技术圈的“创业故事”。对了解行业背景挺有。
如果你想更深入看看HDFS
的结构或者部署细节,我这边也顺手挑了几个还不错的扩展资料,配合着看,事半功倍:
- Hadoop HDFS 分布式存储机制
- HDFS: 大数据分布式存储核心揭秘
- 星环大数据平台 HDFS 分布式存储系统
- 构建大数据 hadoop 分布式集群
- 大数据与 Hadoop 分布式计算框架
- Greenplum Hadoop 分布式大数据方案
- 大数据技术指南 Hadoop 伪分布式部署指南
如果你刚开始搞大数据,这份资料蛮适合收藏着。没时间细读也能扫一遍,后面用到再回来看也方便。