Kylin调研报告预计算与大数据查询优化

预计算的 Kylin，在多维时，响应是真的快。尤其面对大数据查询，不用再等后台一条条扫数据，Cube 里早就准备好结果了。你只管发 SQL，几百 G 数据也能几毫秒出结果。

Apache 家的 Kylin，用的是MOLAP的方式，把查询前能想到的维度组合都算好存起来，换点空间，省下好多时间。说白了，就是提前干好活，用户查询时直接拿结果，体验嘎嘎爽。

你要是用Hadoop、Hive，或者搞BI 报表，Kylin 能接得自然，配置 Model、Cube 建一下就行。界面也是图形化的，点点选选挺顺的，不折腾。

我之前搞一个电商销售项目，要看“地区-品类-时间”的组合查询，用 Kylin 做了 Cube，直接几千 W 条数据照样秒出结果，用户体验一下子就上来了。比起直接查 Hive，效果天差地别。

还有个点是，Kylin 支持MySQL、Oracle等其他数据源，整合起来挺方便的，不是 Hadoop 一家独大。如果你有多个数据来源，也不用太发愁。

但也不是没有坑。预计算虽然快，但 Cube 太多太大了，存储压力也挺大。建议你一开始就想好常用的查询维度组合，别太贪。Cube 太碎的话，维护起来也麻烦。

如果你常大数据的多维，而且查询性能卡得你难受，真的可以看看 Kylin。尤其你做 BI，响应时间短点，用户满意度能高不少。