数据挖掘方向的电子教材资源挺全的,基本上从入门到进阶都能覆盖到。像是韩家伟的《数据挖掘》和经典的《数据仓库(第四版)》,内容系统,概念讲得透,适合平时查阅也适合刷一遍梳理思路。
电子书打包里还带了《数理统计基础》和几个练手用的 PDF,比如《数据挖掘入门》,对刚接触这块或者想回炉重造的都挺友好。你看完这些,SQL、数据清洗、挖掘算法基本都能整明白。
想练手的话,可以顺手看看相关链接:比如数据挖掘技术概述(韩家伟),还有统计方面的深入探索高等数理统计,配合用 MATLAB 动手练下MATLAB 数理统计上机练习也不错。
嗯,有时间可以翻翻数理统计数据包合集,里面一些原始数据集还挺有意思的,自己练模型或者做个 demo 都能用得上。
如果你刚入门数据仓库或者准备搞个数据挖掘相关的 Side Project,这套资料还蛮值一看,别光收藏,动手才是硬道理。