天池的推荐算法数据集挺适合练手的,尤其是关注用户兴趣变化的那部分内容,做推荐系统的朋友应该会感兴趣。数据时间跨度是 11.8~12.8,包含用户点击、行为序列之类的,格式清晰,字段比较全,适合做时间序列建模或测试动态图建模。

推荐系统里,传统算法多时候默认用户兴趣不变,其实不太靠谱。这套数据就比较贴合现实,用户兴趣每天都不一样,像你刷短视频、逛电商,也都是即时反应的。

比较适合用来练习短期兴趣建模兴趣漂移识别,还能试试深度学习里的序列模型,比如 RNN、Transformer,或者来一发 LightGCN 的时间版本?

如果你想拓展一下,还可以看看下面这几个资源:解耦长短期兴趣建模那篇蛮有参考价值,MovieLens则是老朋友了,比较适合初学者入门。

用这类数据记得注意时间戳字段,预别乱顺序,最好用 sliding window 或 session-based 方法来切数据,更贴近真实应用。

如果你最近在做推荐算法的实验,尤其是需要动态兴趣建模的数据,不妨试试这个,挺上手的,而且场景真实,调模型的时候也有成就感。