多位大牛合著的《DataMining》,内容是真挺硬核。讲的是怎么从一堆又脏又乱的数据里,挖出那些你平时根本想不到的规律。比如你能想到信用卡欺诈可以靠行为模式预测吗?书里就有这样的例子。

内容分得挺细,从基本概念到算法实现、从工具选型到实际案例,连那些你平时看不懂的术语,这书也讲得还蛮清楚的。决策树聚类关联规则这些经典算法,基本都有讲,代码思路也比较接地气。

文件名叫Data+Mining+Know+It+All-November+2008.pdf,看名字就知道是走“知之甚详”路数,内容覆盖面广,属于那种你翻一次能用好久的资源。

出版社是Morgan Kaufmann,专做计算机技术书籍的那种,靠谱。印刷用的也是酸性自由纸,收藏党可以放心收。书号是ISBN 978-0-12-374629-0,你要查文献用得上。

适合谁看?初学者用来打基础蛮不错,行业内的开发、研究人员拿来参考案例也挺值的。你要是刚上手数据或者做数据产品,不妨从这本开始。

对了,如果你想了解算法细节,也可以顺带看看数据挖掘知识发现算法这篇文章,蛮有的。