笔记本上装个 Hadoop 集群听着麻烦,其实搞懂流程也就那回事。这篇叫《数据仓库与大数据工程实验一笔记本安装集群操作文档 V2.02》的文档,写得还挺实在的。一步步带着你装虚拟机、搭环境,连每个软件版本和路径都列得明明白白。
从装虚拟机程序开始,一路搞到三台虚拟服务器跑起来,弄个以Hadoop为核心的大数据平台,整个流程全,适合新手练手。
文档里没单讲原理,更多是“怎么操作”,这种实战派风格挺贴合学生或刚入门的工程师。VMware
怎么选、Hadoop
集群怎么分节点、配置文件放哪,基本都覆盖了。
你要是想看不同搭建方式,可以看看这些相关资源:CDH那篇挺适合做企业级集群的,mac的那篇也有点意思,MacBook 用户别错过。
建议你按文档搭完一遍,熟悉下Hadoop的部署思路,后面再玩Spark、Kafka这些才不容易懵。
如果你有三五台老机器或者云主机,也可以仿照文档改装下路径,思路是通的。