- 解释 Spark 在大数据和 Hadoop 生态系统中的作用
- 使用不同部署模式创建 Spark 集群
- 控制和优化 Spark 集群和应用程序的运行
- 掌握 Spark Core RDD API 编程技术
- 使用高级 API 平台结构(包括共享变量、RDD 存储和分区)扩展、加速和优化 Spark 程序
- 高效地将 Spark 与 SQL 和非关系数据存储集成
- 使用 Spark Streaming 和 Apache Kafka 执行流处理和消息传递
- 使用 SparkR 和 Spark MLlib 实现预测建模
火花大数据分析教程
相关推荐
大数据分析
这本书是关于大数据分析的教科书,由斯坦福大学知名教授Anand Rajaraman和Jeff Ullman整理编写而成,内容非常实用。
数据挖掘
12
2024-10-12
大数据分析代码
Scala 实现的大数据分析代码,包括最高在线人数、登录日志分析、付款情况分析等。
spark
15
2024-05-13
Python金融大数据分析教程合集
金融的 PDF 教程、常用的 Python 库、实战案例都在这个压缩包里了,内容挺丰富的,适合你慢慢啃。Pandas 的用法、数据清洗、时间序列建模、还有股票数据抓取啥的,都讲得蛮清楚。对金融数据刚入门或者想系统学一下的朋友,这份资源还挺值得一看的。
数据挖掘
0
2025-06-13
大数据气象数据分析
基于Spark进行气象数据处理和分析
项目完整报告
可直接提交作业
spark
18
2024-04-30
大数据分析与挖掘
第一章:数据分析基础理论- 数据分析概述- 大数据分析基础- 大数据预测分析
第二章:计算机数据分析SPSS Modeler- SPSS Modeler概述- SPSS Modeler节点介绍
第三章:计算机数据分析Hadoop- 大数据平台Hadoop
算法与数据结构
18
2024-04-30
大数据分析研究
本研究仅供参考,请勿抄袭。为您的学习负责,请独立完成作业。
Storm
19
2024-06-30
大数据分析与应用案例分析
大数据的与应用案例讲得还挺细的,尤其是对Hadoop生态的拆解,蛮适合刚入门或者想系统捋一遍的前端朋友看一看。嗯,它不是讲怎么撸代码,但对你理解大数据架构、后端接口、数据流转逻辑挺有。Hadoop 的HDFS是怎么存储 TB 级数据的,MapReduce怎么拆解计算任务都说得明明白白,还顺带提了下YARN、Hive这类常见工具,干货不少。另外,国内外的技术发展也顺手提了一嘴,虽然不是重点,但能帮你大致知道业界都怎么玩,算是长点见识。如果你最近在搞可视化平台、BI界面、或者和后端协作搭数据功能,推荐花半小时扫一遍这篇。需要动手的朋友也可以顺着下面这些链接看一看,像《构建大数据 hadoop 分布
spark
0
2025-06-16
金融大数据分析配套代码
Python语言编写的金融大数据挖掘和分析案例配套代码。
算法与数据结构
16
2024-05-20
Rhadoop: 解锁大数据分析潜能
深入剖析Rhadoop的开发技术,探索利用Hadoop框架进行高效并行运算的奥秘。该书内容经典,助您驾驭大数据分析领域的核心工具。
数据挖掘
13
2024-05-25