数据挖掘基础 10 章 ppt 课件的资料还挺全,适合刚接触这块的朋友入门。每一章内容都分得比较细,从最早的数据预到后面的建模和模型评估,讲得蛮系统的。像分类、聚类这些热门算法,也都有例子配合,不枯燥。
配套的几份 PDF 也比较实用,《数据挖掘基本概念与技术(韩家伟)》那份算是理论框架的核心,常见的模型像决策树、支持向量机都有讲,适合搭配 PPT 一起看,理解更完整。
另外还有两份工具教程,一份讲SAS,一份讲Clementine。SAS 这套东西偏企业场景,功能强大但上手稍微有点门槛;Clementine 图形界面比较友好,初学者用起来轻松,像拖拽式建模、自动调参这些都挺贴心的。
你要是想系统地学一遍数据挖掘,这份 10 章 PPT 加上几个软件教程和理论资料,算是比较全面的入门包了。顺手还能看看下面几个关于关联规则的数据挖掘拓展内容,实战中用得也挺多的。
推荐你顺手点进去看几个相关链接,比如:聚类与距离度量、关联规则挖掘综述,里面讲的方法和案例都挺实用的。
如果你正准备做数据项目,或者是对挖掘算法感兴趣,花几天啃完这套内容,思路会清晰不少。学着建个模型跑跑,也挺有意思的。