商场销售数据信息的数据集,适合想练手销售预测模型的你。数据量不小,5681 条测试数据+8523 条训练数据,够你玩一阵了。涵盖 2013 年 Big Mart 十家店、1559 种产品的销量数据,产品和门店属性也都标出来了,像Outlet_Size
、Item_Type
这类字段挺实用的。
嗯,数据里有缺失值,要记得预,不然模型效果会打折。你可以试试用RandomForest、XGBoost这些模型跑一下,表现都还不错。也适合上手做特征工程,尤其是Item_Visibility
这类变量,挺考验经验的。
如果你是前端转数据方向,或者想搞点电商数据来玩玩,这套数据还蛮推荐的。不仅能练建模,数据探索阶段也有料,图表、分布、相关性都能练一遍。
推荐你顺手看看这些相关资料,像零售终端类型信息和新零售大数据架构平台,对理解背景也有。如果你还没玩过零售数据,这套真挺适合入门的。