最早提出 PCA 的论文,嗯,还真挺早,1901 年就有了。卡尔·皮尔逊那会儿就在研究多维空间里点云的最佳拟合线,换句话说,就是找出数据背后的“走向”。现在用 PCA 搞降维,其实就是在走他当年的老路子。这玩意儿用在图像压缩、特征提取上都挺顺手,思路也蛮清晰:标准化、算协方差、搞特征值、选主成分、降维——五步走。你平时搞前端数据可视化、图像,或者玩点小型的机器学习模型,用它清洗一下数据、把维度压压,都挺合适的。