数据挖掘的套路配上统计学的严谨思维,嗯,挺香的组合。

数据挖掘与统计学的结合,有点像前端遇上 TypeScript ——原本就能跑,加点结构更稳。这里的内容更偏应用型,海量数据这块讲得比较细,尤其是数据库适配问题,说得蛮实在。

像你如果是刚接触这块,建议先看看统计学入门那篇,搭个底子会舒服不少。数据挖掘算法部分也有讲,配合着看效率高。哦对了,SAS 教程那篇也不错,拿来练手刚刚好。

空间数据挖掘那个新视角的文章,思路蛮有意思,和常规讲法不太一样。还有个讲 MATLAB 的,也值得一看,代码风格清晰,用来跑模型还挺稳。

如果你本身做开发,但想理解统计在业务、用户行为建模上的实际用法,这一系列文章都可以当参考。想动手试试?从 数据概括性度量 的统计点开始练手也不错。