Ambari 2.7 的安装和配置,在 CentOS 7 上其实不算复杂,但前期准备真的蛮关键的。硬件要求这块,像内存、磁盘、CPU 啥的,建议一步到位,别省。比如内存最起码 16G,跑得动是能跑,但真要搞大点的数据,128G 起步更安心。
磁盘的话分离存储重要。离线模式最少两块盘,实时模式得上三块,HDFS、Kafka、系统文件分开来放,后期跑起来稳定不少。哦对了,磁盘尽量大小一致,免得数据分布不均。
至于 Ambari 本身的包,官方地址都给得比较清晰了,比如HDP、HDP-UTILS和Ambari Server。都可以提前下好,放在本地部署方便又省事。链接里都直接给出了,不用挨个找,挺贴心的。
操作系统建议用 CentOS 7.4,稳定还好配,JDK 就上 1.8.0_60,别太新太老都不省心。装完系统,像 RAID 选项这些最好在前头就想好,RAID 0 性能上确实还不错。
环境变量那块别忘了设,不然到时候部署 Hadoop 时找不到 JAVA_HOME 可不好排查。JDK、Maven、Hadoop 配置一下路径就行了,命令也都挺简单:
export JAVA_HOME=/opt/software/jdk1.8.0_60
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export MAVEN_HOME=/opt/apache-maven-3.5.0
export PATH=$PATH:$JAVA_HOME/bin:$MAVEN_HOME/bin
export HADOOP_CONF_DIR=/etc/hadoop/conf
如果你是打算搭一个稳定的集群环境,建议花点时间在前期准备上,机器分配、盘位安排都先想好,后头省下不少事。