压缩优化的 Apriori 算法,运行效率提升不少。传统 Apriori 跑大数据集时,候选项太多、数据库还要反复扫,真挺伤的。这个算法思路蛮巧,先压缩数据,减少扫描次数,再过滤无效候选集,整体响应快多了。你要是做数据挖掘,尤其是物联网那类海量数据场景,可以试试看。还有一些挺实用的相关文章,代码实现也比较详细,想深入研究也方便。