知识发现的前沿玩法和数据挖掘的高级技巧,藏在《Advanced Techniques in Knowledge Discovery and Data Mining》这本书里。内容挺硬核的,但不是那种看了头疼的纯理论,里面有不少实际可落地的思路,尤其适合已经入行一段时间、想往深水区探索的你。

英文原版的内容,讲得蛮系统,从数据挖掘的基本流程,到专家系统里的知识获取方法都有覆盖。专家系统知识发现这块讲得挺细,还穿插了不少案例场景,对提升建模和特征提取能力挺有的。

高清扫描版,虽然偶尔有点小 OCR 识别瑕疵,但整体质量不错。Springer出版,老牌学术出版社,靠谱的。2005 年出的,不过内容更新到了当时的技术前沿,像一些早期的集成学习和模式识别方法,今天看也不算过时。

Nikhil R. PalLakhmi Jain 编的,他们本身就是在机器学习领域有影响力的人物,学术功底扎实,也有逻辑。顺带说一句,系列编辑是 Xindong Wu,对数据挖掘圈子稍微了解的,应该都听过他名字。

还有一点不错:书里也提到了数据挖掘在专家系统和医疗领域的结合,和你在做算法落地、或者搞点研究项目时挺对口。感兴趣的话,你可以顺着这个方向看看像医疗统计专家系统这类内容。

如果你现在正在用 Matlab 或在搞 多 Agent 系统,还可以参考蚁群算法和专家系统结合的研究,和这本书讲的理念不谋而合,拓展一下思路不错。

,这本书属于那种值得放在硬盘角落慢慢啃的资料。如果你想系统补齐 数据挖掘 的高级部分,又不想陷入空洞的理论推演,这本还挺合适的。

ISBN 是1-85233-867-9,去图书馆或者外网找资源都挺方便。如果你英文阅读没太大问题,强烈建议收藏一本。