关联规则挖掘算法里的规则隐藏,真的是个挺有意思的方向。OSA 算法算是比较实用的一个,思路也蛮灵活。它不是单纯砍掉规则,而是通过加点东西、设点限制,把支持度置信度搞低一点,巧妙隐藏那些敏感的信息。

你要是平时接触数据挖掘,尤其是做那种要隐私数据的项目,这篇论文就挺值得一看。讲得比较细,思路也比较清晰。重点是,它没有绕的数学公式,读起来还挺顺。

而且里面提到的优化策略,也能应用在类似的Apriori多层关联里,大数据的时候还能顺带优化一下性能,效率也能提上去。实操性还不错。

建议你顺便看看这些相关文章:像Apriori 算法那篇就讲得挺清楚的,还有Hash Tree 优化的思路也蛮实用,是在跑大数据集的时候。

如果你最近在做和数据安全规则挖掘相关的内容,可以拿来对比一下思路,说不定能找到更优的方案。