CDH6 的升级真不只是换个版本号那么简单,它几乎是一次“系统重装”级别的更新。相比 CDH5,Hadoop、Spark、HBase这些主力组件都升级了大版本,不光性能提上去了,多 API 也有变化。你如果用的是老项目,得改点代码,嗯,还得测得够细才行。
CDH6 用的是Hadoop 3,像是 Spark 直接干到2.4.0,比起 CDH5 里的 1.6 和 2.3,体验是飞跃。HBase也从 1.2 升级到2.1,有不少接口不兼容,反正你想省事就别直接套旧逻辑,适配一下挺有必要的。
系统支持这块 CDH6 也有变化,Debian 直接砍掉了,主推 RHEL、CentOS、SLES 这些。内核版本要求也高了,像是 RHEL 得配上更高版本的内核才稳。而且数据库那边,MySQL 要 5.7 起步,PostgreSQL 得 10+,你要是还在用老库,得留意一下。
JDK 也有变化,CDH6 不支持 JDK7了,只保留了对JDK8的支持,而且推荐用特定版本,最好别乱装。你要是用 OpenJDK,记得 CDH5.16 之后才开始支持得好,CDH6 是没问题的。
组件方面,Oozie升到 5.0,Impala也上了 3.1,功能和性能都增强不少,蛮适合搞大规模调度和 SQL 的场景。CDSW和 Navigator 倒是没动,它们的定位挺稳定的,升级不会有啥坑。
,CDH6 是一次比较大的技术跳跃,不光功能多了,生态也更现代化了。不过嘛,升级成本不小,建议你先搞个测试环境跑跑,别一口气全上生产。如果你对性能和新功能有追求,那这波升级还是挺值的。