UIUC 的 CS512DM 资料,挺适合想深挖数据挖掘的你。不光覆盖了常规的分类、聚类这些老朋友,连图挖掘、隐私保护这些偏高级的内容也有涉及。课程是 2021 年春季的,讲义啥的估计是用 LaTeX 写的,文档看着还挺舒服。就算你没上过这门课,也能靠这些资料快速熟点套路,少踩坑。

CS512DM 的课程资源,属于那种“内容硬核但不晦涩”的风格。包括了从数据预图神经网络的内容,全流程都有。适合你如果在搞SparkXGBoost这类大数据项目,找灵感或者参考实现用。

课程里讲的东西也挺贴地气,不是那种只会堆概念的风格。像DBSCANLightGBM这种你日常建模经常用到的工具,在这里不仅讲原理,还会带你做实验,效果一目了然。

再加上有LaTeX格式的文档,适合你做笔记或引用。是如果你要写论文、技术报告,这些模板直接套用都省不少事。

建议你下载资源的时候留意一下有没有作业或者项目指南,实践部分往往才是干货。如果你刚好想复现一些模型流程,或者撸个 benchmark,挺值得参考的。