如果你在做主成分(PCA)方面的工作,是需要筛选特征值因子时,特征值因子的筛选方法可以说是挺实用的。简单来说,就是在对特征值按大小排序后,删除掉那些占比小的特征值,通常是总和的 15%以下。这样做的好处是,剩下的特征值累积贡献率超过 85%,还能保证主成分对原始变量有足够的解释力。值得注意的是,这个比例不一定是硬性规定,更多时候是一个经验值。不过,如果你还需要进一步精确,像相关系数的平方和也能你选择合适的主成分。这里没有过多展开,但相关方法还是有多成熟的理论和实践。,这个步骤对数据降维、数据清洗时都挺有的。对于其他类似的应用,建议先做个初步筛选,再决定是否进一步细化。