知识点比较全的 xmind 整理,覆盖了从HadoopHiveHBaseSparkFlumeZookeeperDorisRedis等一整套大数据生态,适合需要梳理整体框架或者准备面试的同学。内容结构清晰,用来补漏查缺挺方便。

大数据方向的东西,光靠记不太靠谱。像HadoopHive这些组件,之间关系挺绕,一不小心就搞混。这个 xmind 能帮你把整个数据流程捋清楚,从数据采集到存储、再到计算,逻辑链条都画出来了。

Flume配合Kafka搞实时日志采集还挺常见,和Spark Streaming组合用效果不错。你可以参考这篇实时日志与异常检测的例子,搭配 xmind 效果更佳。

还有像ZookeeperHBase的关系,多人一开始都分不太清。你可以看看这个集成部署教程,再配合 xmind 梳理下组件角色,思路就更明朗了。

面试复习的话,强烈推荐搭配这份大数据面试题详解来看,一边看题一边在 xmind 上标记对应知识点,效率翻倍。

如果你刚上手大数据开发,又觉得文档太散、内容太多,不妨试试用这张 xmind 图来建个总览。需要深入的地方就点进下面这些文章看,知识就不容易忘。