数据挖掘的入门书太多,但《数据挖掘_-_概念与技术.pdf》这本真挺经典。内容覆盖广,讲得也不算太抽象,是前面几章,概念部分讲得还蛮清晰,适合边看边实践。
决策树的部分写得比较细,像 ID3、C4.5 都讲了,适合你想了解下各种决策路径怎么来的时候翻一翻。搭配这篇决策树算法详解看,思路更清楚。
Apriori 算法那章也还不错,虽然偏概念,但逻辑推得比较顺,建议结合Apriori 关联规则算法的文章一起看,能帮你理清关联规则挖掘的基本套路。
PDF 本身也挺友好,排版不花哨,查个概念还挺方便,适合用来做知识补充。如果你在做后台数据可视化、埋点统计相关的需求,建议多看几遍,会有不少启发。
哦对了,还有点干货链接,像决策树分类算法和关联规则数据集辅助资料也可以收藏下,适合你做算法实验或课程设计用。