该 PPT 提供了 Spark 的入门指南和在大数据分析中的实战应用。
Spark 实战教材 PPT
相关推荐
Spark实战
深入了解Spark,一本全面指南,帮助您驾驭Spark的强大功能。
spark
11
2024-04-30
Spark & Spark Streaming 实战学习
深入掌握 Spark 和 Spark Streaming 技术
课程资料囊括代码示例和环境配置指导。
授课内容基于经典案例,助您构建扎实的理论基础与实战经验。
欢迎共同探讨学习心得,交流技术问题。
spark
21
2024-04-30
Spark in Action实战教程
Spark 的实战教程《Spark in Action》挺适合刚入门或者想系统进阶的朋友。上来就带你跑 Spark CLI,命令行用起来比你想象的顺手多了。慢慢就开始撸代码了,核心 API、SQL、实时流、机器学习一个不落。
结构化数据、流式数据、图数据都能玩,尤其是像GraphX这样的模块,用来做图计算真的还挺灵活。嗯,书里还准备了一个预配置好的虚拟机,代码拷进去直接跑,省事不少。
如果你对Spark Streaming感兴趣,可以看看这篇实时流示例,代码写法和调试方式讲得挺清楚的。再深入一点,还可以看看GraphX 图计算框架的实战案例。
建议你用的时候注意下资源管理,尤其是大数据量并发场
spark
0
2025-06-15
Spark 2.0 实战精粹
全面解析 Spark 2.0 代码,助力深入学习。获取方式: 链接
spark
17
2024-04-30
Hadoop 2.0 实战 PPT
这份 Hadoop 2.0 实战 PPT 文档未经任何修饰,内容是原始版本,供大家学习交流。
Hadoop
16
2024-05-23
并行计算导论MPI实战教材
并行计算的实战教材,中科院的《并行计算导论》算是比较硬核的一本。内容偏技术流,讲的是怎么用Linux配合MPI干高性能的活儿,比如数值积分、矩阵求解、FFT、二维泊松方程这些常见问题的并行解法。
操作环境挺接地气的,基于Linux,代码也不绕,用过命令行的你肯定能上手。多例子直接跑MPI就行,像mpirun -np 4 ./fft_solver,响应也快,调试也方便。
有意思的是书里不仅讲怎么干活,还讲怎么干得快。比如在并行矩阵求解那里,提到了稀疏矩阵怎么分块传输,怎么避免通信阻塞,嗯,读起来蛮有收获的。
如果你对并行算法有点兴趣,推荐顺手看看几个相关的资源:MPI 并行 WARSHALL 算
算法与数据结构
0
2025-06-24
Spark实战高手之路:Scala动手实战(1)
掌握Scala,轻松驾驭Spark实战!
spark
30
2024-04-30
Spark MLlib推荐算法实战
Spark 推荐算法挺有意思的,尤其是它的 MLlib 库,能让轻松实现各种推荐系统。如果你需要做个推荐系统,MLlib 里的协同过滤算法和基于内容的推荐策略都能帮你大忙。举个例子,协同过滤会根据用户的历史行为来找到相似的用户或物品,从而推荐你喜欢的商品。而基于内容的推荐,则通过物品的特征,给你推荐相似的物品。其实,你可以灵活地把这两种算法结合起来,效果会更好。推荐系统在电商、社交平台都能看到它的身影,像是淘宝、Netflix 用的都是类似的推荐技术。嗯,要用 Spark 来做,要做数据预、构建模型、评估结果,才能把它用到实际场景里。如果你也想搭建个推荐系统,Spark 的 MLlib 真是一
spark
0
2025-06-15
Spark实战学习指南
Spark入门实战系列文档,内容丰富,分十章介绍,涵盖Spark生态、编译部署、编程模型、运行架构、Hive、SparkSQL、SparkStreaming、SparkMLlib、SparkGraphX和分布式内存文件系统Tachyon等内容。
spark
23
2024-05-13