支持海量数据的 PetaBase,真是做大数据时的一个好帮手。基于 Hadoop 和 Hive,但又比传统的 Hive+MapReduce 快得多,查询速度那叫一个爽,基本上秒级返回,效率挺高的。你只要熟点 SQL,像SELECT
、JOIN
这些操作,直接在 HDFS 或 HBase 里查数据也没压力,响应也快,体验还不错。
集群部署的 BI@Report也挺灵活的,支持在多台服务器之间跑,节点状态还能自动同步。你用的时候不用担心单点故障,而且资源利用也更高,适合数据量比较大的业务场景。
产品国际化也考虑到了,BI 3.2 以上版本已经支持多语言,像简中、繁中、英文都 OK。如果你做海外项目或者团队里有人用英文界面,那这个就挺贴心的。
另外,给你贴几个相关的教程,方便你一站式搞定:
- Hadoop+Zookeeper+HBase 集群部署指南
- Zookeeper+Hadoop+Hbase+Hive 安装部署教程
- Hadoop 集群搭建 HBase 集群
- CentOS7 搭建 Hadoop2.7.7 全家桶
- 用 HAProxy 实现 Hive 高可用
- Docker 部署 Hadoop 集群脚本
- Hive 应用实例 WordCount
如果你平时经常大数据,或者在做大屏项目,那 PetaBase 这套还蛮值得折腾一下的。是你想快速响应、低延迟,又不想被 MapReduce 拖慢节奏,那它真挺合适。