### Hadoop2.x 环境搭建详解
#### 一、概述
Hadoop 是一款开源软件框架,用于分布式存储和处理大型数据集。Hadoop 的核心组件包括 HDFS(Hadoop Distributed File System) 和 MapReduce。将详细介绍 Hadoop2.x 环境的搭建过程,并提供一系列基本操作指导。
#### 二、准备工作
在开始安装 Hadoop 之前,需要完成以下准备工作:
##### 1. Linux 环境配置
- 修改主机名:确保主机名符合规范(不能以数字开头,不能包含特殊字符)。
- 执行命令:
vi /etc/sysconfig/network - 查看配置:
cat /etc/sysconfig/network - 主机映射:通过编辑
/etc/hosts文件添加主机名映射。 - Linux 下执行:
vi /etc/hosts - 添加行:
ip地址 主机名 - Windows 下的主机映射文件路径:
C:/windows/system32/drivers/etc/hosts - 网络配置:确保网络配置正确。
- 查看网络配置文件:
cat /etc/sysconfig/network-scripts/ifcfg-eth0 - 确认
ONBOOT参数设置为yes,表示开机自启网卡;BOOTPROTO设置为static,表示使用静态 IP。
##### 2. JDK 安装
- 推荐使用单一用户(非 root 用户),如
hadoop。 - 创建目录:
mkdir /opt/software /opt/modules- 存放位置:
/opt/software:用于存放.tar.gz等软件包。/opt/modules:用于存放已安装的软件。- 权限设置:
chown -R hadoop:hadoop /opt/modules /opt/software/- 安装 JDK:
- 解压:
tar -zxf jdk-7u67-linux-x64.tar.gz -C ../modules/ - 配置环境变量:
- 编辑
/etc/profile:bash export JAVA_HOME=/opt/modules/jdk1.7.0_67 export PATH=$PATH:$JAVA_HOME/bin