PageRank 算法的简单迭代实现,思路清晰,逻辑不绕。图里的节点和边先列出来,按公式一轮一轮算,结果收敛得还挺快。讲稿里把推导过程也写得挺明白,照着走基本不会出错。
MapReduce 的实现方式也顺带讲了,适合大规模网页数据,尤其适合用在 Hadoop 上。用 Java 配合 Hadoop API 写一下,分布式跑起来,效率高不少。
你要是搞大数据或者做搜索引擎优化,这份讲稿还挺值得看看。配套资源也丰富,从基础的 PageRank 到具体代码实现、MapReduce 分布,内容层次清晰,有理有据,查资料也方便。