大数据学习过程里的珍藏版笔记,都是我边学边整理的,内容挺全的,涵盖了从 Hadoop 入门到 Spark、阿里云认证这些。嗯,最重要的——全都不用花资源分,白嫖也能学得起飞。
Hadoop 的基础入门笔记,逻辑挺清晰,像 大数据 Hadoop 笔记 这篇就挺适合初学者,讲 MapReduce 的原理时候用了生活场景举例,看一遍就懂了。
想快速掌握整体框架的可以看看 学习笔记汇总,像 HDFS
、YARN
这些模块串得蛮紧凑,适合你通读一遍之后再挑重点复习。
如果你习惯用脑图看知识结构,那个 XMind 文件别错过,层级做得蛮细,翻着翻着就理清楚关系了。
写 Python 的你会更想了解 Spark 部分,那篇 Python 学习笔记——深入理解 Spark 大数据平台 就比较实用,比如用 RDD
做数据那块,配合 Python 写法也得明白。
还有些内容更贴近实际,比如 大数据技术与实践学习笔记,讲的都是项目开发中会踩的坑,像 数据倾斜
的,写得就还不错。
如果你也在准备阿里云大数据认证,那份 阿里云大数据专业认证学习笔记-20200106.pdf 值得一看,知识点标注得清晰。
,这些资源不花一分钱,就能拿来过一遍核心知识。如果你正准备入门或者在补基础,建议先通读一下,选几篇结合起来复习,效率还挺高的。