Redoop 的 Hadoop 发行版,挺适合刚入门或者要搭建私有集群的你。

Redoop CRH 4.9 X86_Hadoop是基于 Apache Hadoop 优化过的版本,专为 X86 架构设计,部署起来没那么费劲。手册内容也挺细,像安装、配置、HDFS、MapReduce、YARN 这些核心组件都有讲,还配了实例,能直接上手操作。

HDFS 的部分讲得比较清楚,比如NameNodeDataNodeClient怎么协作,还有怎么通过FSShell命令行操作分布式文件系统,蛮实用的。

MapReduce那块也没绕太远,直接带你写程序,理解 Map 和 Reduce 的流程。如果你之前对这个模型有点懵,这里能帮你顺清楚逻辑。

YARNZookeeper也有专章,讲了资源调度、节点协调这些底层逻辑,虽然偏基础,但足够你搭个实验环境练手。

整体上看,这份文档比较适合自己折腾 Hadoop 的小伙伴,是做私有部署、学习分布式架构、或者想拓展大数据栈的前端/全栈开发者。哦对了,想继续挖的可以看看下面这些相关文章,都是实战向的。

如果你最近想用 Hadoop 搭数据框架,可以试试这个版本,上手简单,还能学到不少底层原理。