关联规则支持度计算与Hash Tree优化

算法与数据结构 25

515KB 2025-06-17

#数据挖掘 # 关联规则 # Apriori # Hash Tree # 频繁项集 # 候选集 # 算法优化 # 支持度

候选集的支持度计算，其实挺讲技巧的。候选集数量多到吓人，一笔交易能匹配好几个，这时候硬算不现实。用Hash Tree去组织这些候选集就方便多了——内部节点是哈希表，叶子节点挂着项集和支持度。查询的时候靠一个Subset函数，能一下找出交易中包含的所有候选集，效率还不错。适合大批量数据，逻辑也挺清晰。