Windows 上的 Hadoop 配置其实没那么麻烦,hadooponwindows.zip
这个压缩包就挺省事的。里面的文件专门了 Windows 下的兼容问题,比如那个老是被吐槽的winutils.exe
,它也包含了。安装时只要把bin
目录下的文件复制进你本地的%HADOOP_HOME%\bin
,注意别直接替换已有的文件就行。
解压完你会发现,基本上 Windows 上跑 Hadoop 需要的执行文件都在里面了,省去了到处找依赖的烦恼。尤其是刚开始玩大数据的同学,这包对你来说蛮友好,少踩坑,配置顺利,跑个 MapReduce 都能一次过。
需要注意的是,环境变量要配好,比如HADOOP_HOME
,还有把%HADOOP_HOME%\bin
加进PATH
里,这样你在命令行直接敲hadoop version
也能响应。不然明明配好了却提示命令不存在,是不是抓狂?
用这个包的思路清晰:你负责下好包、配好环境,它负责让你少出错、快启动。对比在 Linux 上折腾配置文件、权限之类,Windows 环境用它真的是图个方便。
如果你是 Windows 用户,又不想一开始就搭虚拟机或者 WSL,推荐你先试试这个hadooponwindows.zip
。能跑起来的 Hadoop 环境,才是入门方式嘛。