最新实例
Apache Flink和Elasticsearch助力实时OLAP平台
如果你也在为实时数据头疼,Apache Flink和Elasticsearch会是你想要的方案。这两个工具目前在大数据领域相当火热,尤其是在实时 OLAP 平台的建设上。Apache Flink能够流畅地海量数据流,低延迟、高吞吐量的实时计算,适合需要即时反馈的应用场景。而Elasticsearch则是在存储和检索数据上表现出色,能轻松应对大数据量的存储与快速查询,且高可用性和扩展性强。如果你像去哪儿网一样,需要一个高效、灵活、且能够应对大规模数据的系统,那么这两者结合绝对不容错过。去哪儿网就用了这套组合,搭建了一个实时 OLAP 平台,实现了数据的高效、可视化展示以及精准查询。尤其是在写入
flink
0
2025-06-13
Flink Forward China 2018PPT合集
Flink 社区的年度技术大餐——Flink Forward China 2018 的 PPT 合集,讲真,挺值得一看。里面的内容覆盖得挺全,不光有实时计算的核心原理,还有不少一线实战经验,像是窗口操作、状态管理这些常用功能讲得都比较透。
这些 PPT 主要围绕Apache Flink展开,适合那些对流刚入门、正在摸索,或者已经在用 Flink 做项目的人。内容不光有干货,还有一些思路和架构方案,比如结合Kafka、YARN、Kubernetes做资源调度那块,看完多少会有点启发。
要说哪个点比较实用?Flink SQL那部分还挺有意思,讲了怎么用 SQL 直接写流逻辑,开发效率提升不止一点点
flink
0
2025-06-13
Flink 1.7实时计算框架
Flink 1.7 是一个蛮强大的流框架,适合做实时数据的项目。如果你对流、批都感兴趣,这个版本真的是不容错过。Flink 1.7 加入了多新特性,像是DataStream API让你能流数据,Event Time可以帮你乱序数据的问题,Stateful Processing也适合做复杂的实时计算。
不仅如此,Flink 还做了批流统一,批也能通过DataSet API轻松搞定。而且它的故障恢复机制和高可用性也挺值得注意的,像是Savepoints和Checkpoint都能保证在任务升级或重启时不丢失状态。还有 Web UI 可以实时监控,调试也方便,直接定位问题。
,如果你是流的开发者,Fl
flink
0
2025-06-12
Apache Flink 2019.09.21北京站Meetup分享资料
Apache Flink 的北京 Meetup 分享资料,整理得还挺全,压缩包里都是当时的演讲 PPT,内容比较硬核,适合想深入了解 Flink 的朋友。讲了多实战内容,比如怎么做状态管理、怎么保证高可用,甚至还有一些 SQL 和 Table API 的用法,入门也能看懂。还有和 Kafka、HDFS 这些常见组件的整合方案,对做实时项目挺有的。如果你最近在搞流式,或者考虑从 Spark 转向 Flink,不妨翻一翻这个 PPT 集,里面不少干货。
flink
0
2025-06-12
Flink 1.9.2实时计算框架Scala 2.12Hadoop 2.7.2
Flink 1.9.2 是一个挺实用的分布式流框架,支持 Hadoop 2.7.2 和 Scala 2.12。它的二进制包已经编译完成,直接用就行。你可以在项目中快速集成,减少了自己去配置环境的麻烦。适合需要大数据的场景,像实时数据流、ETL 任务等。如果你还没接触过 Flink,这个包能让你快上手,而且速度也挺快。
如果你是做大数据的开发者,尤其是在使用 Hadoop 和 Scala 的环境下,这个包是方便的。你只要下载后解压,配置好环境变量,就能马上开始使用,免去了一堆复杂的安装步骤。
提醒一下,Flink 1.9.2 虽然稳定,但对于新项目来说,最好关注一下更高版本,会有更多的功能和性能
flink
0
2025-06-12
Flink实时计算框架与Pravega高吞吐存储架构总览
Flink 的实时能力加上 Pravega 的高吞吐存储,组合起来可以说是流式数据的一对黄金搭档。架构设计上也挺清晰,从数据采集、缓存、计算、存储到,全流程都考虑到了,而且每一块都有比较成熟的组件支持。数据 Sources 那块支持挺多,像Kafka、Kinesis、Pub/Sub这些主流流源都能对接,比较灵活。你如果项目上已经用了这些,接入 Pravega 也不麻烦。Ingest Buffer是个亮点,用 Pravega 来当缓存区,性能还不错。是在数据量大的场景下,不容易丢数据,吞吐量也跟得上。适合做日志收集、IoT 设备上报这类高频写入。是Streaming Engine,Flink 在
flink
0
2025-06-12
Flink实时计算框架作业执行流程
Apache Flink 是一个强大的流框架,适合大规模实时数据。你可以把它理解成一个超级高效的管道,不仅支持高吞吐量、低延迟,还能精确的状态管理和事件时间。Flink 的作业执行流程挺复杂,但你只要掌握了其中的 4 层转化流程,就能更加得心应手。,用户代码定义转换操作生成流图(StreamGraph),将其转化成作业图(JobGraph),再到执行图(ExecutionGraph),,任务会按照物理执行计划被分配到集群上执行。每一层转化都为后续的高效调度和任务执行奠定基础。想象一下,这个过程就像给你的任务装上了引擎,推动它快速执行,效率杠杠的。嗯,掌握了这个流程,你的 Flink 代码优化会
flink
0
2025-06-12
StreamGraph生成Flink流数据底层过程解析
StreamGraph 的生成其实就是 Flink 中流式数据的底层过程。简单来说,当你在代码中写下数据流的操作时(比如通过transform方法),Flink 就会将每个操作变成流转换的一部分。这些操作会被保存在一个叫StreamGraph的结构中。最核心的部分是StreamGraphGenerator.generate(env, transformations),它接受一个操作列表,生成一个完整的流图。其中,StreamTransformation就是流转换的关键,它代表了从一个或多个DataStream生成新的DataStream。如果你理解了这个过程,整个 Flink 流模型就能更加清
flink
0
2025-06-12
Flink旨在以闪电般的速度处理连续的数据流。这个简短的指南将向您展示如何下载、安装和运行最新的Flink稳定版本。您还将
$ vi Dockerfile FROM daocloud.io/library/centos:7 MAINTAINER ljy RUN mkdir /usr/local/jdk WORKDIR /usr/local/jdk ADD jdk-8u211-linux-x64.tar.gz /usr/local/jdk ENV JAVA_HOME /usr/local/jdk1.8.0_211 ENV JRE_HOME /usr/local/jdk1.8.0_211/jre ENV PATH $JAVA_HOME/bin:$PATH ADD flink-1.14.4-bin-scala_2.12.
flink
0
2025-06-12
大数据技术高频面试题解析
如果你正在准备大数据相关的面试,或者想要加深对大数据技术的理解,这份《大数据技术之高频面试题.pdf》绝对是个不错的选择。它包含了从面试到手写代码、从项目架构到具体技术的全面内容,基本上涉及了你能想到的各类大数据技术,甚至还有 JavaSE、Redis、MySQL、JVM、JUC 等一系列常用的技术细节。对于你理解项目架构和常见问题也挺有的,是项目经验这一块,给了不少实际的案例和解答。而且它不仅仅是个参考资料,还有模拟考试,你进行巩固,真的实用。嗯,如果你是刚接触大数据的新人,这份资料可以给你多实践中的洞察,你更好地应对面试和实际工作中的挑战。
flink
0
2025-06-11