李雄飞老师的《数据仓库与数据挖掘》课件,讲得还挺接地气的,内容不光有原理,还有不少实战思路。像星型模型OLAP 切片K-means 聚类这些常用概念,讲得比较系统,适合刚入门的同学慢慢啃。

课件里的数据仓库结构设计部分,我觉得挺有参考价值。是讲怎么构建维度表事实表那块,图解清晰,思路也清楚。就算你之前只写过前端页面,看完也能知道数据团队在干嘛。

数据挖掘算法这块也讲了不少,像决策树支持向量机,每种算法后面都有案例,比如电商推荐、金融欺诈检测这类,讲得还挺接地气。你要是想了解算法怎么用在业务上,这部分内容还蛮适合翻一翻。

我比较喜欢他对数据清洗的——少有老师能把缺失值异常值讲得这么直白,甚至还提到了怎么应对实际中碰到的脏数据,挺实用的。

另外还讲到了数据隐私保护,比如 GDPR 和匿名化这些,虽然对写前端的来说用不上,但了解一下大背景也有好处。哦对了,相关的资料可以从下面这些链接找:

如果你在做 BI 可视化,或者和后端配合业务数据,看看这个课件会有不少灵感。是理解他们的数据流程,沟通起来就不会像鸡同鸭讲。