Hive 的 SQL 风格执行逻辑,讲得挺清楚的,适合平时用 SQL 多、但又想搞大数据的前端或者数据开发看一看。
用 SQL 写 Hadoop 任务听起来挺高级,其实用惯了 SQL 之后,Hive 上手没那么难。比如你习惯写SELECT
查表,那在 Hive 里也一样能搞,底层还是 MapReduce 或者 Tez 帮你干脏活累活。
这份 PPT 里把 Hive 的执行过程讲得比较细,从你写下SELECT
语句开始,到它怎么转成执行计划,怎么跑在 Hadoop 上,基本上都有覆盖。嗯,理解了执行过程之后,调优也不慌了。
想了解更多,可以顺手翻翻这几篇文章,Hive 和 SQL 的关系、Hive 在大数据场景下的表现、还有一些面试题啥的,链接我都贴下面了,建议保存。
如果你平时 SQL 写得溜,又想碰一碰 Hadoop 这摊事儿,那这份 PPT 还蛮适合的,简单直接,挺实用。