黑白分明的章节排版,加上逻辑清晰的内容结构,《数据挖掘入门》这份资料看着就挺舒服的,读起来也顺畅。嗯,如果你刚开始接触数据挖掘,这本真的是个不错的起点。
数据的预讲得比较细,什么缺失值、异常值都有提到,关键是讲得不绕口,举了不少贴近实际的例子。比如怎么有噪声的数据,挺实用的。
OLAP、数据仓库和挖掘算法之间的关系,解释得还蛮清楚。尤其是讲到OLAP 结果怎么反过来喂给挖掘模型用,这一段写得挺有启发的,你读完估计就有点思路了。
技术部分也不算枯燥,像决策树、K-means、Apriori这些算法,作者都捋了一遍。没直接扔代码,但给的思路够你自己写出基本版的了,蛮适合动手型选手。
资料还顺带讲了一嘴数据仓库和OLTP的区别,不深入但够用了。链接里推荐的几篇文章也不错,可以一起看看,尤其是那个 OLAP 的应用解析,读完脑子清爽。
如果你是搞前端可视化或者BI 报表这块的,对数据这部分内容不太熟,那建议你把这篇资料翻一翻,搞懂背后逻辑,做图的时候也有底。