预计算的 Kylin,在多维时,响应是真的快。尤其面对大数据查询,不用再等后台一条条扫数据,Cube 里早就准备好结果了。你只管发 SQL,几百 G 数据也能几毫秒出结果。
Apache 家的 Kylin,用的是MOLAP的方式,把查询前能想到的维度组合都算好存起来,换点空间,省下好多时间。说白了,就是提前干好活,用户查询时直接拿结果,体验嘎嘎爽。
你要是用Hadoop、Hive,或者搞BI 报表,Kylin 能接得自然,配置 Model、Cube 建一下就行。界面也是图形化的,点点选选挺顺的,不折腾。
我之前搞一个电商销售项目,要看“地区-品类-时间”的组合查询,用 Kylin 做了 Cube,直接几千 W 条数据照样秒出结果,用户体验一下子就上来了。比起直接查 Hive,效果天差地别。
还有个点是,Kylin 支持MySQL、Oracle等其他数据源,整合起来挺方便的,不是 Hadoop 一家独大。如果你有多个数据来源,也不用太发愁。
但也不是没有坑。预计算虽然快,但 Cube 太多太大了,存储压力也挺大。建议你一开始就想好常用的查询维度组合,别太贪。Cube 太碎的话,维护起来也麻烦。
如果你常大数据的多维,而且查询性能卡得你难受,真的可以看看 Kylin。尤其你做 BI,响应时间短点,用户满意度能高不少。