粗糙集的课件,内容还挺硬核的,适合你想搞清楚什么是属性约简、规则提取的时候看看。讲义是老师内部整理的,资料挺系统,从 RS 理论的起源讲到怎么落地用在数据挖掘里,跨度大但逻辑清楚。

粗糙集的核心是不完整信息,说白了就是你数据不全、样本有噪声,它还能帮你找出哪些字段最关键。比如你做一个问卷,字段一堆,但真正影响结果的就仨,RS 就能帮你找出来。

属性约简规则提取这块讲得还不错,配了例子,思路清晰,代码量也不大,适合自己动手跑一跑。

数据挖掘方向的朋友,是对规则挖掘感兴趣的,可以顺手看看这篇基于扩展粗糙集的近似概念格规则挖掘》,思路还蛮新颖的。

如果你更关注算法落地,可以看看这个《基于 MapReduce 的并行粗糙集知识获取方法》,做大数据的时候也挺有参考价值。

建议你配合代码动手练一下,关键是理解 RS 怎么做约简的,那一块是整个理论的核心。如果你正在学数据挖掘或者做决策系统,这套资料可以当参考笔记用,挺实用的。