大数据的生态结构是个挺庞杂的东西,刚接触的时候一脸懵也正常。这份 PPT 讲得还比较清楚,先从“为啥要用大数据”聊起,慢慢展开讲生态里的各个角色,像是Hadoop、Spark、Hive这些怎么协同运作,挺适合入门了解用的。
大数据平台的选型也是个绕不开的问题,PPT 里提到了一些主流方案,像CDH、HDInsight、Oracle等,适合想搭建自有平台的同学研究研究。要是你正头疼“我这数据到底该怎么”,看看这份资料有思路。
想进一步深入了解,不妨配套看看《Hadoop 大数据生态技术详解》,还有《大数据生态核心知识点》这种总结类资料,结构清晰,踩过的坑都能提前帮你绕开。
嗯,还有一点建议哈,如果你要开始做大数据平台建设或者调研,建议把《大数据生态与推荐资料合集》收藏下,一堆干货,省得到处翻。