5月份的Spark Summit会议部分幻灯片。主要涉及SQL和核心相关内容。总共近200页,选取了几个感兴趣的内容下载分析。包括:利用Apache Spark分析半导体晶圆制造过程中的2TB原始跟踪数据的首个应用案例;在实际行业中构建高效的类Facebook规模的Shuffle服务;使用Databricks Delta大规模构建会话化流水线;通过分解的持久内存优化计算集群资源利用率;如何通过定制优化扩展Spark核心;以及统一数据交换的基于Apache Arrow的Delta Lakes简化变更数据捕获等。
Spark Summit 2019部分PPT改写
相关推荐
Spark+AI Summit Europe 2019第三部分资料合集
Spark+AI Summit Europe 2019 的第三部分 PPT,内容相当丰富,适合想了解数据和 AI 结合玩法的同学。为期三天的大会汇聚了 1700 多名技术人,聊的全是干货,像是Apache Spark、TensorFlow、MLflow、Delta Lake这些热门技术。资源整理得挺全,PPT 是打包的,记得去原网站拿解压密码哦。
讲 Delta Lake 的结构设计,还有怎么跟Spark Structured Streaming配合实时数据,内容讲得比较实在。适合你平时要做数据湖或者实时计算的场景。
还有一些相关资料也推荐你一起看看:比如 Delta Lake 架构文档,或者
spark
0
2025-06-16
Oracle 11g客户端64位部分三改写
Oracle 11g客户端64位部分三的详细内容。
Oracle
8
2024-08-29
Oracle内部数据库培训PPT第四部分
免费获取!Oracle内部数据库培训PPT第二部分,详细介绍公司内部数据库的使用技巧和最佳实践。
Oracle
9
2024-08-23
Oracle 资料下载第11部分
这是Oracle相关资料的第11部分下载链接。
Oracle
15
2024-07-31
Sybase ASE 12.5.2第4部分
SYBASE 的企业级数据库包,分成 5 个部分,这里是第 4 个。文件体积不小,但功能也挺全,适合搭配前 3 个包一起部署。安装流程不算复杂,配置得当的话,性能还不错,稳定性也蛮让人放心的。你要是正在做老系统的数据迁移或维护,拿它练练手也是不错的选择。
Sybase
0
2025-06-13
Presto技术内幕第3部分
Presto 的第三部分资料,JD-Presto 团队出的,内容扎实、结构清晰,尤其是对分布式查询引擎底层机制讲得还挺细的。文件是Presto 技术内幕_part3,格式是 RAR 压缩包,高清 PDF 还带索引和书签,查内容方便。适合对 Presto 源码感兴趣的开发者,尤其是要做查询优化或想了解调度机制的。我自己之前优化 SQL 执行的时候就翻过,里面对Stage 执行模型和Task 调度的还挺有启发的。要是你对Presto结构还不熟,也能借这本快速补课,图示也比较清楚。建议搭配官方文档一起看,对照理解更高效。哦对了,文件名带part3,别忘了和前两部分一起配齐,内容才完整。如果你想深入搞
Hive
0
2025-06-13
Oracle内部数据库培训材料PPT第八部分
免费Oracle内部数据库培训材料PPT第二部分
Oracle
8
2024-08-18
PowerDesigner第六部分详解
PowerDesigner是Sybase公司的CASE工具集,利用它可以便捷地进行管理信息系统的分析和设计,它涵盖了数据库模型设计的整个流程。
Oracle
11
2024-07-27
自制的Form Builder教程PPT贴图格式详解(第二部分)
Dev Suite 10g +emp,dept表的PPT贴图格式教程。
Oracle
18
2024-07-19