影印版的《数据挖掘-概念、模型、方法和算法》,内容还挺扎实的,讲得也比较系统。作者是 Louisville 大学的副教授,嗯,看得出来是有干货的那种。

影印版的《数据挖掘-概念、模型、方法和算法》,内容还挺扎实的,讲得也比较系统。作者是 Louisville 大学的副教授,嗯,专业背景够硬,讲课风格也偏实战,不是那种纯理论一通吹的书。

书里头的模型分类讲得蛮清楚的,从监督学习无监督学习,每种方法都配了例子,像你用分类算法搞用户分群,或者用聚类做推荐系统优化,都能找到对口的方法。

代码不多,主要偏理论框架。但用来梳理思路、搭建项目的初期结构,还是挺不错的。比如你要构建个数据挖掘的前后流程,就能跟着它的数据预 → 建模 → 评估这一套跑。

你要是喜欢多角度对比算法优劣,建议再看看这两个相关资料,内容延展得更深入一些:数据挖掘:概念、模型、方法、算法数据挖掘:概念、模型、方法与算法探析

哦对,初学者看的话会觉得偏厚重,建议你配合点项目实战或者 Kaggle 比赛练一练,印象更深。