大数据实验课上经常要折腾 Hive?那你可以试试这个 apache-hive-3.1.2-bin 安装包,用起来还挺顺手的。
Apache 的 Hive,说白了就是在 Hadoop 上跑的“类 SQL 查询工具”。你只需要写点类似 SQL 的 HQL,它就帮你搞定大数据的查询、。和写 SQL 差不多,轻车熟路。
安装包里配套的东西也蛮全:核心执行引擎、Metastore 元数据存储、命令行工具、JDBC/ODBC 驱动,甚至还有 WebHive 界面,浏览器直接查数据也没问题。
像 hive-site.xml
配置起来也不麻烦,改一下连接信息就能跑。记得先装好 Java 和 Hadoop 环境,不然 Hive 也动不了。
整个流程其实也比较清晰:建表、导数据、写 HQL 查询,再加点 分区、分桶 优化下性能,跑报表啥的香。嗯,如果你还用 Hue 可视化工具,那配合起来也舒服。
另外推荐几个搭配用的资源:比如 hive-metastore-2.3.6.jar 可以搞定 Metastore 的依赖;Hive 面试题也可以刷起来,对理解 Hive 机制挺有。
,apache-hive-3.1.2-bin 安装包比较适合教学场景和初学者练手,也适合你搭个离线数仓的原型环境。如果你正好在学大数据编程,这个包可以省你不少时间。