HiveSQL 的实战题挺适合刚接触大数据仓库的前端或者数据开发了解一下。文档里的题目不难,但都贴近实战场景,像学生成绩对比那题,用到了JOIN
和条件过滤,练手刚刚好。还附带了建表、加载数据的基本语法,照着敲一遍思路就通了。
学生表、课程表和成绩表这种结构其实挺常见的,用 HiveSQL 跑一跑,理解数据仓库里的关联逻辑挺有。查询“01 比 02 课程高分”的题目,也能顺便熟练下LEFT JOIN
和WHERE
条件的组合。
还有个比较实用的点是,文件加载用的load data local inpath
语句,不用你写复杂的导入逻辑,直接搞定。日常测试用挺方便的。如果你正想熟悉 Hive 或者 SQL 在大数据里的用法,这份题目文档可以拿来当入门练习。