Jx-FFST 的过滤器特征选择工具箱,挺适合用来快速搞定特征选择的。内置了四种方法:Relief-FPCCTV还有NCA,都挺经典的。你只要给它喂个数据集,跑一行代码,结果就出来了,响应也快,配置简单,适合做特征初筛。

Matlab 的脚本风格用起来也还不错,就算你不太熟滤波器方法,看官方的示例也能快上手。尤其是在高维数据时,比如基因表达数据、文本分类这种,选特征能省不少事儿。

嗯,说个注意点:NCA相对比较慢,数据多的时候建议提前做点降维。不然你跑起来会等半天。不过其他几个方法像PCCRelief-F,都蛮轻量的,适合快速试验。

你可以直接去看看作者放在 GitHub 上的源码,地址是:Filter-Feature-Selection-Toolbox" target="_blank">Filter-Feature-Selection-Toolbox。工具箱里还附带了 demo 脚本和文档,照着改就能用了。

如果你平时在做机器学习前、特征工程这块内容,尤其喜欢用 Matlab,那这个工具箱可以收藏一下。想扩展 C++实现?可以看看这个 Relief-F C++实现。想玩高级一点的逐步选择,也有SEQUENTIALFS 的改进版可以参考。

如果你想快速测一波多个特征选择方法的效果,看看哪些特征有戏,那这工具箱蛮合适的。