Spark Streaming项目实战数据集
Spark Streaming 项目实战的数据集还挺实用的,适合想上手流式的你。项目里不仅包含主程序,还有各种模拟工具,像是MockRealTime.scala和RandomNumUtil.scala,拿来直接跑起来做测试方便。
Spark Streaming的微批思路,还蛮适合初学者理解实时数据。它不是一条一条,而是把数据切成一小批一小批来干,代码写起来也没那么绕。
项目里的RealTimeApp.scala就像总指挥,配置输入输出,逻辑一把抓。你要是还不太熟 DStream 怎么搞的,看看里面的注释和代码结构,立马就清楚了。
还有几个辅助工具类也蛮贴心的。比如RedisUtil.scala
spark
0
2025-06-14
Spark 程序与 Spark Streaming 的区别
Spark 程序适用于对静态的历史数据进行一次性处理,它利用单个 Spark 应用实例完成计算。 Spark Streaming 则用于处理连续不断的实时数据流,它将数据流分割成多个批次,并利用一组 Spark 应用实例进行并行处理。
spark
16
2024-05-15
Spark Streaming 与 Structured Streaming 解析
深入探讨 Spark Streaming 和 Structured Streaming,剖析其模块构成与代码逻辑,助你透彻理解实时数据处理的原理与应用。
spark
18
2024-05-14
Spark Streaming技术介绍
Spark Streaming技术是基于Spark平台的流数据处理解决方案,能够实时处理大规模数据流并提供高效的数据分析和处理能力。
spark
16
2024-07-13
Spark实战学习指南
Spark入门实战系列文档,内容丰富,分十章介绍,涵盖Spark生态、编译部署、编程模型、运行架构、Hive、SparkSQL、SparkStreaming、SparkMLlib、SparkGraphX和分布式内存文件系统Tachyon等内容。
spark
23
2024-05-13
Spark Streaming 2.3.0 中文详解
全面解析 Spark Streaming 2.3.0 API、知识点和案例,助您轻松掌握流处理技术。
spark
17
2024-05-12
Spark零基础思维导图Spark Core、Spark Streaming、Spark SQL解析
Spark 的零基础思维导图,整理得蛮清楚的,主线就是spark-core、spark-streaming 和 spark-sql,框架清晰,一眼就知道从哪儿下手。适合刚上手 Spark 的同学,像拿来复习也挺方便。
spark-core的部分,基本覆盖了 RDD 的操作方式、分区、累加器啥的,点到为止但挺有用,配合SparkCore 分区与累加器详解看更透彻。
流就看spark-streaming,对流式应用的开发思路有点,像什么 DStream、窗口操作、实时数据统计这些都带到了。嗯,建议搭配SparkStreaming 应用开发指南,能直接跟着做几个小 demo。
spark-sql那块
spark
0
2025-06-14
Spark实战
深入了解Spark,一本全面指南,帮助您驾驭Spark的强大功能。
spark
11
2024-04-30
Spark Streaming实时流处理示例
Spark Streaming 是 Apache Spark 的一个模块,专门实时数据流。如果你想海量的实时数据流,Spark Streaming 是个不错的选择。结合 Kafka 使用,你可以轻松地构建一个强大的实时数据系统。Kafka 作为分布式流平台,能够高效地存储、传输数据,而且还支持多个消费者共同消费同一数据流。比如,使用kafkaStream()来接收 Kafka 中的数据流,可以做一些数据转换,比如map、filter等,甚至可以将数据再发送回 Kafka 或者输出到文件。在实现 Spark Streaming 与 Kafka 集成时,你需要安装好Apache Spark、Sca
spark
0
2025-06-14