Kylin 的搭建过程比较细,踩坑也不少,不过一旦环境通了,SQL 查询速度是真的快,适合做那种多维数据的场景。如果你用过 Hive+HBase,对这套架构应该不会太陌生。Kylin 主要靠 Hadoop 做计算、HBase 存立方体,Hive 管元数据,所以三者得先配好,顺序不能乱。

压缩包用tar -zxvf解开,路径建议放清楚,不续找起来挺麻烦。是配置文件,像hive-site.xml,一定得对上 Hive 的部署环境。尤其是用了Hive on Spark的朋友,连接经常出问题,可以试试把配置文件放到apache-hive/conf下面,不过说实话,这也算是权宜之计,最好还是搞清楚背后机制。

Hadoop 那边,记得把JobHistoryServer启好,不然你查日志都没地方看。用netstat -an | grep 19888看端口在不在监听。配置的话,得加上这些:

mapreduce.framework.name yarn
mapreduce.jobhistory.address master:10020
mapreduce.jobhistory.webapp.address master:19888

改完之后执行:

sh /opt/hadoop-2.7.3/sbin/mr-jobhistory-daemon.sh start historyserver

启动 Kylin,用sh bin/kylin.sh start,默认端口是7070,用户名ADMIN,密码KYLIN。浏览器打开地址比如http://10.3.32.81:7070/kylin,进后台就能开始玩数据了。

,Kylin 搭起来稍微繁琐,但用好了挺爽,适合高并发、对速度要求高的项目。如果你还在用 Hive 查询做 OLAP,不妨试试这个组合拳。