数据挖掘导论的完整版,内容真的是挺全的,尤其适合刚入门或者打算系统掌握数据挖掘的你。书里讲了五个主要方向:分类、聚类、关联、异常检测,还有最基础的数据部分,逻辑清晰,用起来不累。
每个主题都分两层讲,一开始是基本概念和常用算法,比如你熟的k-means
、Apriori
,后面还会深入讲讲优化和进阶玩法。嗯,像分类那部分,从决策树
到支持向量机
,讲得挺透的,适合想继续深入的同学。
图表多,例子也丰富,尤其是案例部分,有不少实际应用,比如做问卷数据、异常检测,感觉上手就能用。重点是对数学要求不高,就算你不是搞统计或者数据库出身,也能轻松啃下来。
你要是平时写前端项目时偶尔需要点数据,了解这些基本模型其实挺有用的。比如你有一堆用户行为数据,想做点聚类看看用户习惯,书里讲的方法就能派上用场。
哦对了,网上还有配套资源,PPT
、习题答案
、数据集
都有,方便自学。需要复现算法或者调试参数时,直接用配套数据就行,挺省事。
如果你对分类、聚类、异常检测这些有点兴趣,可以顺手看看下面几个资源:
如果你平时接触点后台数据,或者做可视化的时候想搞点“智能”推荐,可以拿它当个工具书。比网上随便查靠谱多了。