数据挖掘概念和技术的 PDF,内容蛮扎实的,属于那种你一看就知道花心思整理过的资料。数据仓库、OLAP、多维建模这些基础概念讲得挺清楚,像星型模型MOLAP都有说到,不是那种泛泛而谈的科普。嗯,如果你刚开始接触数据挖掘,或者做 BI 系统时遇到卡壳,这份资料能帮你理清不少思路。

数据预那部分我觉得实用,讲了怎么清洗、归约、离散化这些操作。比如缺失值、数据压缩技巧这些,都是实际工作中老碰到的问题。还讲到了DMQL这类挖掘语言,虽然现在用得少了,但了解一下也没坏处。

而且它不是只讲概念,像类比较关联规则这些也配合了业务场景,比如市场篮子啥的,挺接地气的。整体排版也比较清爽,浏览起来没啥压力,适合一边查资料一边做项目。

如果你最近正好在搭数据系统,或者打算把机器学习跟 BI 结合起来,那这份资料别错过。哦对了,它还有些不错的衍生资源,比如MATLAB 源代码合集,也蛮推荐看看。