Kylin 的搭建过程比较细,踩坑也不少,不过一旦环境通了,SQL 查询速度是真的快,适合做那种多维数据的场景。如果你用过 Hive+HBase,对这套架构应该不会太陌生。Kylin 主要靠 Hadoop 做计算、HBase 存立方体,Hive 管元数据,所以三者得先配好,顺序不能乱。
压缩包用tar -zxvf
解开,路径建议放清楚,不续找起来挺麻烦。是配置文件,像hive-site.xml
,一定得对上 Hive 的部署环境。尤其是用了Hive on Spark
的朋友,连接经常出问题,可以试试把配置文件放到apache-hive/conf
下面,不过说实话,这也算是权宜之计,最好还是搞清楚背后机制。
Hadoop 那边,记得把JobHistoryServer
启好,不然你查日志都没地方看。用netstat -an | grep 19888
看端口在不在监听。配置的话,得加上这些:
mapreduce.framework.name yarn
mapreduce.jobhistory.address master:10020
mapreduce.jobhistory.webapp.address master:19888
改完之后执行:
sh /opt/hadoop-2.7.3/sbin/mr-jobhistory-daemon.sh start historyserver
启动 Kylin,用sh bin/kylin.sh start
,默认端口是7070
,用户名ADMIN
,密码KYLIN
。浏览器打开地址比如http://10.3.32.81:7070/kylin
,进后台就能开始玩数据了。
,Kylin 搭起来稍微繁琐,但用好了挺爽,适合高并发、对速度要求高的项目。如果你还在用 Hive 查询做 OLAP,不妨试试这个组合拳。