多元统计里的因子模型,挺适合你一堆变量却不想逐个的时候。嗯,常见于心理问卷、消费者研究、还有那种啥都想看一眼的探索性项目。数据量一多,就靠它找出背后的隐藏结构了。模型挺经典,代码也不复杂,个原始矩阵就行。

一个p 维指标n 个样本,起来还真不轻松。你会用到类似RSPSS的工具,像 SPSS 就比较适合新手上路,用界面点点就能跑出图,比较省心。要是你习惯代码,那Pythonsklearn.decomposition.FactorAnalysis模块也蛮好用的。

顺手整理了几个还不错的链接,实用性都挺高。比如:因子的数学模型概述,适合入门看看啥是因子模型;多元统计优化那篇,讲得更系统点;协交因子模型也可以看看,算是进阶版。

如果你在做变量降维、或者研究变量之间的相关结构,那强烈建议你花点时间琢磨一下因子。不管是手动写代码,还是用现成工具,效果都还不错。别忘了数据标准化这一步哦,不然跑出来的结果会怪。