统计学习的经典教材《统计学基础:数据挖掘、推理与预测》,真的是前端甚至全栈想了解算法建模时的宝藏资源。
十四章内容,按部就班讲得清楚,从线性回归、分类、SVM,到神经网络、聚类、PCA,真的是应有尽有。
我当初第一次接触lasso
和boosting
,就是看它理解的,配套例子也挺生活化,不枯燥。
像模型评估那几章讲的交叉验证、模型平均,和做 A/B 测试时的思路还挺像,能直接套过来用。
如果你经常要和数据打交道,比如搞可视化、做前端图表展示,这本书会让你更懂背后的逻辑,也方便和数据团队对接。
哦对了,作者是 Hastie 和 Tibshirani 两位大神,还有 Friedman,斯坦福老牌统计大牛,靠谱得。
有网页版、有下载链接,想系统学统计学习,真没必要从头到尾啃,看你想补哪块知识点,翻那几章就行。
如果你对比如聚类、降维感兴趣,可以顺手看看这篇探索无监督学习:聚类、降维与特征提取的文章,蛮有。