正负样本的数据挖掘总是麻烦?这篇《一种正负关联规则的快速查询扩展算法.pdf》算是解闷利器了。思路比较清晰,讲的是怎么在挖负关联规则时,提高查询效率,尤其适合做大数据的朋友看看,响应也快,思路也挺新。
Apriori 算法的基础上做了延展,不是单纯说理论,而是配合例子讲怎么优化查询速度,用过 Apriori
的同学应该都知道它负规则时有点慢,这里用了个扩展策略,效率还挺不错的,推荐试试。
顺带一提,像 Apriori 关联规则算法 这类文章也可以搭配着看,一起对比,理解会更全面。而且它还提到了一些剪枝优化思路,和Apriori 高效剪枝算法那篇也蛮像的。
如果你之前被负关联搞头大,想省时间不踩坑,看看这篇文章还是挺值的。建议搭配自己项目的业务逻辑过一遍,理解更快,用起来也顺手。