图计算项目里的大杀器,Spark GraphX的资料一直不算多。Spark.GraphX.in.Action这份 PDF 算是比较系统的,逻辑清晰,案例也实在,挺适合用来入门或者打基础的。
图结构的数据用起来爽,但一上手就懵?嗯,GraphX 正好能帮你解开这个结。像社交网络关系、推荐系统里的用户-商品图,这些都能搞。
文档里不少示例是基于 spark-graphx_2.12-2.4.5.jar
写的,如果你项目刚好也是 Spark 2.x 的版本,那就贴合。没有花里胡哨的语法,逻辑也直接清晰。
如果你习惯边看边实践,建议先把 GraphX 项目的 jar 包拉下来,比如这个版本的GraphX 2.4.5就挺稳的。跑一遍文档里的代码,理解更快。
顺带一提,Apache Spark GraphX 图计算框架的资料也可以对照着看,补补底层原理。两个结合起来,效率提升不少。
如果你是搞数据挖掘或图算法的,可以花点时间啃一下这文档,虽然是 PDF,但不枯燥,反而还挺接地气。需要的话可以从多个站点下,比如这个也能下。
,GraphX 玩得顺了,图计算不再玄学。PDF 在手,图的套路你懂就行。