黑白对比风格的习题集合,内容覆盖了Spark SQLKafkaHBaseHive这几个大数据主力组件。题目设计还挺有层次的,不只是概念,还带点实战场景,适合平时刷题或者做小测。

Kafka的消息流设计题不错,考的不是死记硬背,而是你到底会不会用。像是怎么消费 Topic、怎么写入到 HBase,动脑筋的时候还挺多的。Spark SQL的几道题也比较接地气,SQL 风格的操作方式对转数据的朋友蛮友好。

你如果正在准备大数据方向的技术面试,或者刚学完 Spark 生态,拿这套练练手挺合适的。顺手还能复习下HiveHBase之间的整合关系,像那种hive-hbase-handler的使用场景也有提到。

顺带推荐几个资源,你可以配合一起看,效率更高:

如果你刚好在复习Hive on SparkKafka 消费流程,或者想捋清Zookeeper的角色,那这波资源真的别错过。