黑白对比风格的习题集合,内容覆盖了Spark SQL、Kafka、HBase、Hive这几个大数据主力组件。题目设计还挺有层次的,不只是概念,还带点实战场景,适合平时刷题或者做小测。
Kafka的消息流设计题不错,考的不是死记硬背,而是你到底会不会用。像是怎么消费 Topic、怎么写入到 HBase,动脑筋的时候还挺多的。Spark SQL的几道题也比较接地气,SQL 风格的操作方式对转数据的朋友蛮友好。
你如果正在准备大数据方向的技术面试,或者刚学完 Spark 生态,拿这套练练手挺合适的。顺手还能复习下Hive跟HBase之间的整合关系,像那种hive-hbase-handler
的使用场景也有提到。
顺带推荐几个资源,你可以配合一起看,效率更高:
- Spark 2 大数据习题 Spark SQL Kafka HBase Hive 练习资源
- 大数据技术面试题详解 —— 题型类似,但更细
- Apache Spark+Flume+Kafka+HBase 的日志系统 —— 想拓展一下可以看看这套实战案例
如果你刚好在复习Hive on Spark
、Kafka 消费流程,或者想捋清Zookeeper
的角色,那这波资源真的别错过。