数据挖掘的入门资料,五份 PPT 打包,内容覆盖从预、分类预测到聚类,讲得还挺系统,适合新手啃。每一份 PPT 都有具体方法,还有算法小例子,比如决策树
怎么做分类,K-means
怎么搞聚类。讲得不算枯燥,偏实用风,课件里也有图有表,清晰好懂。
数据预那一块讲得比较细,比如缺失值怎么、异常点怎么找、数据要不要做归一化这些,真的不是说说而已。Lecture2.pptx
里举了不少可视化的图形例子,像散点图和箱线图这类,对新手比较友好。
分类预测部分就更实战了,Lecture3.pptx
讲了随机森林
、SVM
和神经网络
,顺便还带点回归模型,思路清楚。每种方法都配了点案例,像预测房价、识别图片那种,比较接地气。
聚类那页也不错,K-means、DBSCAN 这些都讲到了。Lecture4.pptx
里还提到了一点评估指标,比如轮廓系数。你要是对无监督学习感兴趣,这块内容可以重点看看。
关联规则那块资料其实挺有意思的,购物篮讲得通俗,Apriori
和FP-growth
的逻辑都比较清楚,学会之后你能做点用户行为、推荐系统的入门尝试。
如果你刚开始接触数据挖掘
,想从 0 入门并搞清楚每一步是干嘛的,这套 PPT 还是蛮值得一看的。顺便贴几个相关文章,扩展学习也方便: