大数据的资源合集里,这份 2018 版的整理真挺实用的。像是你平时搞、玩,或者部署个集群啥的,都能在这里找到对口的开源工具和教程,集合得比较全,也更新得还不错。

Hadoop、Spark、Flink这些主力框架的学习资源、环境包甚至是集群搭建教程,全都一应俱全。你点进去看看,就知道能省多少摸索时间。

比如装Ambari搞一套可视化管理环境,或者用HBase+Phoenix来跑实时查询,还有RowKey的设计示例,讲得都比较接地气,蛮适合刚入坑或者要优化老项目的。

资源里也带了一些面试题学习指南,别小看,多细节就是在这类资料里被捡回来的。刷一刷这些内容,对面试和实战都挺有的。

如果你最近正想搭个分布式环境或者研究大数据生态,可以把这些文章先收藏下来:

资源虽老,思路还新,适合自己搭环境练手。如果你还在为选哪个工具发愁,不妨从这里下手看看。