可视化运维的 Cloudera Manager,用过的朋友都说香。大数据集群的部署、配置、监控,几乎全流程都能接手,尤其适合企业场景,自动化程度高,操作也直观。
CDH 环境的部署太琐碎?用Cloudera Manager
就轻松多了,自动化安装、配置同步、服务启停全搞定。而且 UI 做得不错,界面清爽,响应也快。
服务端 + Agent 架构挺经典的。服务端负责控制逻辑,Agent 部署在每台机器上,干活的主力就是它。中间还串了个数据库,用来存配置和监控数据,推荐你分离部署,方便扩展。
集群的事儿,最怕的就是出问题找不到原因。Cloudera Manager 的监控功能挺强,HDFS、MapReduce、HBase 的状态、吞吐量都能一眼看到。报警机制也蛮细,出了事立马能知道。
想追求高可用、可回滚?它也考虑到了,支持滚动升级、配置版本管理,还有集成 Kerberos 安全方案。再搭上BDR 备份机制,容灾也不愁。
多租户环境下,资源怎么分配?YARN + Linux 容器的动态+静态资源隔离做得还不错,再加上资源监控,你可以放心开多个项目,不用担心互相打架。
如果你要部署 Hadoop 集群,又不想重复踩坑,Cloudera Manager 是个蛮稳的选择。想详细研究的话,可以看看这份 PDF 文档:Cloudera-Manager.pdf
,讲得挺全的。