Spark+AI Summit Europe 2019 的第三部分 PPT,内容相当丰富,适合想了解数据和 AI 结合玩法的同学。为期三天的大会汇聚了 1700 多名技术人,聊的全是干货,像是Apache Spark、TensorFlow、MLflow、Delta Lake这些热门技术。资源整理得挺全,PPT 是打包的,记得去原网站拿解压密码哦。
讲 Delta Lake 的结构设计,还有怎么跟Spark Structured Streaming配合实时数据,内容讲得比较实在。适合你平时要做数据湖或者实时计算的场景。
还有一些相关资料也推荐你一起看看:比如 Delta Lake 架构文档,或者 Databricks 示例,看完你对 Delta 的理解肯定更清楚。
如果你想搞清楚 Spark 跟 AI 怎么打配合,这套资料还挺值得收藏的。开发环境不确定?就从官方提到的版本入手,比如 Spark 2.1,还有 MLflow、Koalas 等也能配合起来用,组合拳嘛,效率高。
哦对了,.zip
压缩包需要解压密码,去原文链接看一下就行。如果你想从源码层了解 Spark 架构,也推荐你翻翻 这本源码小册,内容挺实用。
一句,如果你正准备做 AI 模型上线,或正在构建数据平台,这套 Summit 资料能给你不少启发,建议早点看,别等踩坑才回头找资料哈~