候选集的支持度计算,其实挺讲技巧的。候选集数量多到吓人,一笔交易能匹配好几个,这时候硬算不现实。用Hash Tree去组织这些候选集就方便多了——内部节点是哈希表,叶子节点挂着项集和支持度。查询的时候靠一个Subset函数,能一下找出交易中包含的所有候选集,效率还不错。适合大批量数据,逻辑也挺清晰。