清甜香组分筛选的变量工具合集,功能上是挺细的那种。Mann-Whitney-Wilcoxon 检验配合 SPA 和 Moving Windows-PLS,这组合用下来,能从烟叶里筛出味道够“清甜”的关键成分,不用靠拍脑袋,全靠数据说话。
SPA 的阈值设在 >0.345,选出的几个成分像 11.92
、13.06
这些,主要集中在 11.5-15.5
和 24.5-28.0
区间,和感官数据也挺契合的。加上 MW 法 的成分窗口选取,比如 RSMECV>2.5
的时候,分类准确率能冲到 88.20%
,还是挺靠谱的。
文件名、参数啥的都有列,实用性高。数据里还标了不同方法下的准确率对比,比如 SPA 的全数据准确率 66%
,MW 方法下提升到 73.6%
甚至 75.5%
,差别一目了然。
如果你是搞天然植物提质、香气成分方向的,或者对非参数统计+PLS 感兴趣,这套工具值得一看。想深入点,还可以参考文章里提到的 Matlab 工具,链接都给你备好了,像 MW1cdf 和 PLS 源码 都能直接用。