主成分的几个链接,真的是挺实用的一套资料包,尤其是做问卷调查或用户行为的你,不妨一看。像那个关于“二孩生育效用”的研究,就是靠主成分把公众的生育动机分了好几类,什么经济、保险、繁衍、享乐都有。这时候,搞懂PCA是怎么降维、提取核心因素的就挺关键。
Python 的主成分讲得蛮直白,代码示例接地气,你想边学边跑一遍自己的数据也完全没问题。再比如那个主成分的几何诠释,视觉化解释 PCA 原理,看一眼就豁然开朗。你要是数据比较多,推荐先看降维利器那篇,有点像实战攻略。
还有专门讲MATLAB和princomp
函数的内容,如果你老系统里一直跑 MATLAB 脚本,建议直接收藏。反正你是要跑主成分,不管用 Python 还是 MATLAB,核心思路都一样:先把高维数据简化,再提取主要成分,做回归或聚类都方便。
如果你现在正做用户调研、行为研究、或是公共政策,PCA 用得好,数据“说话”的能力会强多。有空点进去几篇看看,操作层面的细节也挺丰富的。