韩家炜的《数据挖掘概念与技术》第二版英文原版,讲得真是挺透彻的。书的结构比较清晰,概念解释也直白,尤其适合刚入门或者准备深入搞数据挖掘的朋友。嗯,第二版相对第三版,内容更稳定,例子也更贴近实际场景,多人其实也更推荐这一版。

英文原版的好处就是保留了原作者的表达逻辑,看起来会更贴近教材的原意。像association rulesclassification这类关键点讲得挺细,还配有案例,做项目的时候能直接套上去。

顺手推荐几个相关的资源页面,还挺有参考价值的:

如果你最近在学数据挖掘,或者正好在做类似项目,这本书真挺值得反复啃的。尤其是用到聚类分类算法模式挖掘这些模块,翻一翻就有灵感。

哦对了,建议搭配使用Weka或者Scikit-learn来练习,会更直观。如果你英文阅读还行,不如就从这版开始啃,收获更大。