数据挖掘领域的老司机大多都听说过这本《Data Mining:Practical Machine Learning Tools and Techniques》,名字挺长,但内容真不啰嗦。理论讲得比较系统,实践案例也蛮多,适合那种想边学边上手的你。
决策树、朴素贝叶斯、KNN、SVM……这些常见的机器学习算法在书里都有,不是那种光讲公式的书,配了不少实际案例,代码逻辑也清楚。像WEKA
这种工具,书里也讲得挺细,安装、使用都带着手把手讲的那种。
前期的数据预也讲得比较实在,什么数据清洗
、归约
、变换
都有提到,哪一步该注意什么,读起来一目了然。嗯,适合做企业项目或者学生科研时参考用。
书后面的部分讲到了关联规则挖掘、文本挖掘、时间序列这些稍高级点的内容。对想要拓宽技术视野的你来说,绝对不是鸡肋。像做用户行为
、金融风控
这种场景,里面的知识挺派得上用场。
如果你已经接触过一点机器学习基础,这本书可以让你走得更深更稳;如果你是刚入门,也别担心,写得不算艰涩,慢慢读也能跟得上节奏。建议配合着WEKA
练练手,效果更好。
你也可以看看这些相关资源:
如果你正在做数据或机器学习类项目,这书真挺值得一读的,代码实用,理论不难啃。