冠军方案的实战套路,贴合业务场景的推荐策略,用得好直接拿来应对公司项目都没问题。这份分享来自天池-安泰杯跨境电商智能算法大赛,核心任务就是预测用户在 AliExpress 上接下来会买啥,提交的商品越准、排名越靠前分越高。
赛题的设计挺有意思,数据按“人货场”逻辑组织,用户的点击、浏览、加购、购买行为都有记录。常见字段像user_id、item_id、event_time、buy_flag这些,基本能拼出用户全链路的购物旅程。
方案核心分成召回+排序两步,比较聪明的一点是——先把用户按“是否历史交互”分群,针对性做召回策略。比如历史交互用户,你就可以大胆把交互过的商品全量召回来。冷启动用户的话,可以上点流行榜、相似用户什么的做个基础召回。
排序部分用的也不复杂,常见的LightGBM、XGBoost都在用,有的选手甚至直接上Embedding + MLP。特征设计嘛,不要瞎凑,一些交叉行为特征比如“最近三天点击数”其实蛮有效。
比赛评价指标是MRR(Mean Reciprocal Rank),简单说就是你推荐得越靠前越吃香。别光堆精度,有时候要想办法提升前几名的命中率。
哦对了,想了解更多用户行为的思路,可以看看这些文章:
如果你正好做推荐系统、想搞点个性化推荐,或者在优化排序算法,这个方案真的挺值得一看,拿来做 benchmark 也蛮方便的。