数据挖掘的课程资料还挺全的,尤其是对一些经典算法讲得比较透。像决策树随机森林K-means这些,都配了案例,入门友好。

课程里的第三版课件内容覆盖面广,从数据预讲到模型评估,整个流程都有,而且还穿插了不少实际应用场景,像市场、医疗预测这些。

关联规则部分挺有意思的,用啤酒和尿布那个例子讲得通俗易懂。还有Apriori算法的,也比较实用。你做电商推荐系统会有用。

KDD 流程也讲了,嗯,虽然概念比数据挖掘大一圈,但这套课程把它拆解得蛮清楚,从数据选择一直到知识表示,都讲了怎么落地。

要学这套内容,建议你对Python有点熟,是用pandas清洗数据的部分,课程不会详细教语法。还有就是统计基础也别太差,不然看算法部分会有点吃力。

文档里还提到了readme.txt,率是学习指南,会给你一些学习路径建议、练习题或者项目,搭配主课件用会更高效。

课程资源还推荐了几个相关链接:数据挖掘知识发现算法关联规则多层关联规则,扩展学习可以看看。

如果你打算系统地学数据挖掘,又不想从零碎资料中拼,那这份资料集还蛮值得一看的,节省时间,效率也高。