浙江大学的《数据挖掘教程》讲得还挺扎实的,适合想系统入门数据挖掘的朋友。从数据仓库、OLAP 讲到聚类和电商实战,内容跨度大,概念解释也比较通俗,PPT 也做得还行,适合一边啃一边查资料消化。尤其是像关联规则挖掘分类预测这类知识点,用到了不少经典算法,像AprioriK-means,有些地方还能直接迁移到工作中用。

数据仓库的架构OLAP 的多维部分我觉得讲得蛮清楚的,适合搞 BI 系统或者报表的同学,概念和用法都覆盖到了,切片/切块/钻取那些操作如果你平时做数据会经常碰到。

数据预那块也别跳过,像数据清洗、归一化这种操作,前期不做,后面挖掘效果也不会好,别问我怎么知道的(心酸史)。聚类也是个常用场景,像电商里的用户分群,跑个K-means就能看出谁爱买、谁白嫖。

教程是 PPT 形式,内容还蛮全的,不用一次啃完,可以按模块慢慢来。如果你正好要准备数据挖掘相关的项目或者课程,不妨去看下,也可以搭配下面这两份延伸阅读一起用:

数据仓库与数据挖掘关联规则挖掘关联规则挖掘数据挖掘中的关联规则,配合起来看会更有感觉。

如果你想从“会用 Excel”迈向“能做模型”,这套资料会是个不错的起点。