贝叶斯方法的变量选择,用来做时序预测还挺有一套的。Bayesian Variable Selection for Nowcasting Time这篇 KDD 2013 的论文,用的是稀疏贝叶斯回归那一挂的思路,高维数据时挺灵活。里面的数学有点硬核,但思路清晰,代码实现也不算复杂,能直接落地。

做短期预测或者临近预测(Nowcasting)的朋友,可以重点看看这篇。它的核心是:用贝叶斯框架动态选择哪些变量有用,哪些该踢掉,跟特征选择那套有点像,但更智能。适合数据量大但信息稀疏的场景,比如社交媒体、金融时间序列之类的。

如果你熟 Matlab 或者有用过贝叶斯工具包的经验,那上手这套会更快。Matlab上也有些类似的资源,比如 贝叶斯工具包稀疏贝叶斯程序,配合来看更清楚。

哦对了,还有个挺有意思的应用:贝叶斯追凶模型,虽然不是时序预测,但思路类似,用贝叶斯逻辑推理未知事件。蛮适合扩展思路。

总结一句,如果你正在搞动态预测、数据维度又多,想要一个不那么“死板”的特征选择方式,试试这篇。搭配点实战代码,更有感觉。