Hadoop 的伪分布式配置文件挺适合刚接触大数据的小伙伴。只要一台电脑,就能模拟出集群的运行环境,学习成本低还蛮实用。配置流程也不复杂,从解压安装包、改环境变量,到几个关键 XML 文件的设置,基本一套流程走下来就能跑起来。像core-site.xml里设定fs.defaultFShdfs-site.xml里改复制因子这些,都是比较常规的操作。还有像mapred-site.xmlyarn-site.xml这些也都涉及资源分配的设置,配合着start-dfs.shstart-yarn.sh,一套组合拳打完就可以用浏览器打开http://localhost:50070验证效果,体验感还不错。

如果你正在学习 Hadoop、想跑个本地测试环境,这份配置文件真的可以好好用一下,出问题的话也方便排查。