Windows 下跑 Hadoop 的时候,少不了一个叫WinUtils的小工具。它相当于 Hadoop 在 Linux 下那些命令行工具的“翻译官”,没它多功能都跑不起来,像权限设置、HDFS 命令这些全得靠它兜底。尤其你用的是 2.6.5 或者 3.2.1 版本,找对 WinUtils 版本关键,版本不对直接报错,挺烦的。
WinUtils 的安装其实不复杂,核心就三步:下载、解压、配置环境变量。你可以去 GitHub 或者一些国内镜像站找,比如名字叫winutils-1-master.zip
。下载完解压到比如C:\hadoop\bin
,记得路径不要有空格,省得后面出幺蛾子。
就是配置环境变量。系统属性里加个HADOOP_HOME变量,值填C:\hadoop
;再把%HADOOP_HOME%\bin
加到Path
里头。配置完重启命令行窗口,输winutils
看有无输出,有就是成功了。
一步,记得在Hadoop 的配置文件里也设置一下,比如core-site.xml
里加:
fs.defaultFS
hdfs://localhost:9000
hadoop.home.dir
C:\hadoop
这样一来,基本配置就搞定了,Hadoop 服务就能在本地 Windows 上跑起来。你可以用hadoop fs
跑点 HDFS 操作,比如创建文件夹、上传文件啥的。如果你打算试试 Spark 或者 Flink,WinUtils 也帮得上忙。
对了,记得下载的时候对好版本,2.x 用 2.x 的 WinUtils,3.x 就找 3.x 的,别图省事混着用,不然调试半天你都不知道问题在哪。如果你刚开始玩 Hadoop,建议在 Windows 上先跑一跑,熟悉下流程再转 Linux,上手更轻松。