如果你正在探索流引擎,**Streaming 101** 和 **Streaming 102** 绝对不能错过。这两篇文章由**Tyler Akidau**,深入了流计算引擎的基础和高级概念,带你了解流的关键技术。**Streaming 101** 适合刚入门的开发者,了流的基本概念,了流的定义、模型等;**Streaming 102** 则进一步了实际应用中的流引擎如何执行,针对 **Apache Flink**、**Spark Streaming** 等技术进行了深入。要是你对流计算感兴趣,这两篇文章是不错的入门材料,理解了这些,做起流项目就会更加得心应手。
Streaming 101入门指南 Streaming 102进阶实战
相关推荐
Spark & Spark Streaming 实战学习
深入掌握 Spark 和 Spark Streaming 技术
课程资料囊括代码示例和环境配置指导。
授课内容基于经典案例,助您构建扎实的理论基础与实战经验。
欢迎共同探讨学习心得,交流技术问题。
spark
21
2024-04-30
Spark Streaming 与 Structured Streaming 解析
深入探讨 Spark Streaming 和 Structured Streaming,剖析其模块构成与代码逻辑,助你透彻理解实时数据处理的原理与应用。
spark
18
2024-05-14
Spark Streaming项目实战数据集
Spark Streaming 项目实战的数据集还挺实用的,适合想上手流式的你。项目里不仅包含主程序,还有各种模拟工具,像是MockRealTime.scala和RandomNumUtil.scala,拿来直接跑起来做测试方便。
Spark Streaming的微批思路,还蛮适合初学者理解实时数据。它不是一条一条,而是把数据切成一小批一小批来干,代码写起来也没那么绕。
项目里的RealTimeApp.scala就像总指挥,配置输入输出,逻辑一把抓。你要是还不太熟 DStream 怎么搞的,看看里面的注释和代码结构,立马就清楚了。
还有几个辅助工具类也蛮贴心的。比如RedisUtil.scala
spark
0
2025-06-14
Structured Streaming概述
Structured Streaming 的编程模型挺友好,适合之前用过 Spark Streaming 的朋友。以前那套 RDD 微批的方式其实有点绕,Structured Streaming 把它搞成了类似 SQL 的风格,写起来清爽不少。
Streaming 数据的一大难点就是“实时”两个字。Structured Streaming 的设计思路就挺聪明的,把数据看成一张永远追加的表,你写 SQL 或者 DataFrame 操作就行,系统自动搞定底层的增量,响应也快。
你写个readStream,接 Kafka、Socket 都行,再配个writeStream输出到文件、数据库,甚至控制台
spark
0
2025-06-13
Spark Streaming技术介绍
Spark Streaming技术是基于Spark平台的流数据处理解决方案,能够实时处理大规模数据流并提供高效的数据分析和处理能力。
spark
16
2024-07-13
Pro Spark Streaming实时处理指南
实时的利器,适合你这种想搞明白Spark Streaming怎么玩的开发者。一本书讲透微批的来龙去脉,什么是把实时数据分批搞,怎么做到既快又稳,都说得明明白白。响应也快,代码也好维护,蛮适合做实时日志、告警系统的。讲到RDD和DAG,作者也没绕圈子,直接就用直白的话解释了概念,嗯,挺接地气的。就像老司机带你上高速,一路有方向、有细节,连Kafka、Flume、Socket这些常用数据源接入也讲到了。窗口函数、容错机制这种事,做实时系统的你肯定关心。书里不仅讲了怎么用,还给了不少配置技巧和注意点。比如怎么设置检查点、怎么恢复故障,蛮实用的。它还讲到Spark SQL、MLlib怎么和流结合,嗯,
spark
0
2025-06-13
MongoDB实战指南:从入门到进阶
MongoDB实战指南:从入门到进阶
MongoDB,作为一款领先的NoSQL数据库,以其灵活的数据模型和可扩展性,在现代应用开发中扮演着重要角色。本指南将带您深入了解MongoDB,从基础概念到实际操作,助您掌握这款强大的数据库技术。
1. MongoDB核心概念
文档模型:摆脱传统关系型数据库的束缚,采用灵活的文档结构,以键值对的形式存储数据。
集合与数据库:类似于关系型数据库中的表和数据库,集合用于组织文档,数据库则用于管理集合。
数据类型:支持丰富的BSON数据类型,包括字符串、数字、日期、数组、对象等,满足多样化的数据存储需求。
2. 应用场景
MongoDB的灵活性和可扩展性使
MongoDB
19
2024-04-30
Hadoop Streaming基础培训PPT
Streaming 开发的特点挺有意思的,简单来说,Hadoop Streaming 让你通过标准输入传递数据给 map/reduce 程序,再通过标准输出将结果返回给 Hadoop。这种方式主要是通过将问题转化成(key, value)对来进行,感觉符合大数据的逻辑。你可以把整个过程分成多个(map, reduce)阶段进行,而默认情况下,key 和 value 之间是 分隔的,简单明了。如果你有需要做数据流,Hadoop Streaming 简直是个不错的选择。
Redis
0
2025-06-17
Spark Streaming 2.3.0 中文详解
全面解析 Spark Streaming 2.3.0 API、知识点和案例,助您轻松掌握流处理技术。
spark
17
2024-05-12