基于协同过滤的推荐算法,配上可解释机制,做出来的推荐系统确实更“聪明”了。用了用户行为打分,还结合了余弦相似度来计算物品之间的相似性,挺适合做个性化推荐那一套的。尤其在大规模数据时,MapReduce 的上场让性能也跟得上,响应也快,逻辑也不复杂。
评分机制这块儿,是通过用户行为信息构造来的,换句话说,不靠用户打分,照样能推荐出你喜欢的东西。评分结果跟用户-物品的多维矩阵结合,再走一波余弦相似度,就能算出哪个商品跟哪个商品“像”。用在电商平台上,推荐的东西会更准,也能解释为啥推荐这个。
指标方面也挺全,准确率、精确率、F1 值、RMSE这些通通能算,适合喜欢看数据的你。数据来源是阿里云天池 2017 年淘宝数据集,量够大,分布也真实,拿来测试推荐效果挺靠谱。
如果你对协同过滤算法有点兴趣,下面这些资源可以一起看,是搞过 Spark、Hadoop 的朋友,里面还有基于 Django 的项目哦:
- 协同过滤商品推荐系统
- Spark 协同过滤推荐系统
- Hadoop 大数据协同过滤推荐系统
- K12 学习平台协同过滤推荐系统
- 协同过滤 RMSE 计算代码
- 协同过滤推荐算法机器学习与大数据应用
- 基于 WUM 和 RBFN 的推荐方法
- 电商平台精准推荐背后的秘密
- 基于 Django 的图书推荐系统
- 协同过滤与 k-means 聚类
如果你最近正想整一个个性化推荐系统,或者在优化已有的推荐算法,拿这个当参考还挺实用的。嗯,适合数据量大、用户活跃度高的场景。