基于云计算环境的 web 数据挖掘算法,挺适合你这种对图算法有点研究、还想跑得快的场景。Web Graph 的数据结构用起来比较直观,尤其是在社交网络那种用户关系链复杂的时候,配合力导向算法,图形一出来,关系一目了然,调试也方便。

Web Graph 的数据结构设计得还不错,适合做用户关系,尤其是社交网站的用户数据。力导向算法表现图结构形象,关系链看得清,节点的权重变化也能一眼看出。响应也快,代码也不复杂。

用云计算环境跑图数据挖掘是个加速器,论文里直接用了分布式算法跑 Graph 直径计算,效率提升蛮的。是部署在集群上,分布式并行,资源利用率也高。

部署方案上也有参考价值,比如在 Hadoop 或者 Spark 上跑任务,你可以参考下他们对图数据的切分和调度思路,挺有启发。Graph 算法的场景就多了,像社交影响力、搜索引擎排序优化都用得上。

你要是正好在做社交数据,或者图挖掘优化,那这篇蛮值得一看。建议搭个云环境,跑下他们优化后的算法,对比下结果,有。