基于协同过滤的推荐算法,配上可解释机制,做出来的推荐系统确实更“聪明”了。用了用户行为打分,还结合了余弦相似度来计算物品之间的相似性,挺适合做个性化推荐那一套的。尤其在大规模数据时,MapReduce 的上场让性能也跟得上,响应也快,逻辑也不复杂。

评分机制这块儿,是通过用户行为信息构造来的,换句话说,不靠用户打分,照样能推荐出你喜欢的东西。评分结果跟用户-物品的多维矩阵结合,再走一波余弦相似度,就能算出哪个商品跟哪个商品“像”。用在电商平台上,推荐的东西会更准,也能解释为啥推荐这个。

指标方面也挺全,准确率精确率F1 值RMSE这些通通能算,适合喜欢看数据的你。数据来源是阿里云天池 2017 年淘宝数据集,量够大,分布也真实,拿来测试推荐效果挺靠谱。

如果你对协同过滤算法有点兴趣,下面这些资源可以一起看,是搞过 SparkHadoop 的朋友,里面还有基于 Django 的项目哦:

如果你最近正想整一个个性化推荐系统,或者在优化已有的推荐算法,拿这个当参考还挺实用的。嗯,适合数据量大、用户活跃度高的场景。