关联规则挖掘是数据挖掘技术的一种简便实用方法,广泛应用于各个领域。提出了一种基于部分支持度树的关联规则增量更新算法,专为数据库新增数据时最小支持度不变的情况设计。该算法充分利用已挖掘的关联规则和保留的部分支持度树,显著提升了性能。新算法仅需一次数据库部分扫描即可完成更新,进一步提高了效率。实验结果验证了该算法在关联规则更新问题上的有效性和挖掘效率的提升。
基于部分支持度树的关联规则增量更新新算法(2011年)
相关推荐
基于 CanTree 的分布式关联规则挖掘与增量更新算法研究
关联规则挖掘是数据挖掘领域的核心任务之一。近年来,随着数据规模不断扩大,分布式数据库架构以及数据动态变化的特性对关联规则挖掘算法提出了更高的要求。本研究聚焦于 CanTree 数据结构,提出一种高效的分布式关联规则挖掘算法,并设计相应的增量更新机制以适应动态变化的数据环境。
数据挖掘
15
2024-05-25
关联规则度量:支持度和可信度
规则度量支持度和可信度可用于找出符合最小支持度和可信度条件的规则。
支持度衡量一次交易中同时包含规则中所有项的可能性。
可信度衡量在包含规则中前提项的交易中,结论项出现的条件概率。
例如,若最小支持度为 50%,最小可信度为 50%,则可能获得以下规则:
A → C (支持度:50%,可信度:66.6%)
C → A (支持度:50%,可信度:100%)
这意味着:
购买尿布的客户中有 50% 同时购买了啤酒。
购买尿布和啤酒的客户中有 66.6% 同时购买了啤酒。
购买啤酒的客户中有 50% 同时购买了尿布。
购买尿布和啤酒的客户中有 100% 同时购买了尿布。
算法与数据结构
10
2024-04-30
关联规则支持度计算与Hash Tree优化
候选集的支持度计算,其实挺讲技巧的。候选集数量多到吓人,一笔交易能匹配好几个,这时候硬算不现实。用Hash Tree去组织这些候选集就方便多了——内部节点是哈希表,叶子节点挂着项集和支持度。查询的时候靠一个Subset函数,能一下找出交易中包含的所有候选集,效率还不错。适合大批量数据,逻辑也挺清晰。
算法与数据结构
0
2025-06-17
Apriori关联规则算法
Apriori算法是挖掘关联规则的经典算法,效率较高。本算法对Apriori算法进行了改进,提高了效率。
数据挖掘
11
2024-05-25
数据挖掘中支持度递减的关联规则探索
在数据挖掘领域,支持度递减是一个重要的概念。它指的是随着数据集中项目集的大小增加,支持度递减的规则开始显现。这一现象揭示了在大数据背景下关联规则的变化模式。
数据挖掘
13
2024-07-25
关联规则和动态关联规则简介
本内容适合于数据挖掘方向的硕士研究生阅读学习,对关联规则与动态关联规则做了简介。
数据挖掘
12
2024-04-30
基于关联规则的数据挖掘算法
基于关联规则的数据挖掘算法在毕业设计中具有重要的参考价值,内容清晰且全面。
数据挖掘
13
2024-05-13
关联规则算法Apriori学习
来学习关联规则算法Apriori吧!
数据挖掘
22
2024-05-25
关联规则隐藏算法研究
关联规则挖掘算法里的规则隐藏,真的是个挺有意思的方向。OSA 算法算是比较实用的一个,思路也蛮灵活。它不是单纯砍掉规则,而是通过加点东西、设点限制,把支持度和置信度搞低一点,巧妙隐藏那些敏感的信息。
你要是平时接触数据挖掘,尤其是做那种要隐私数据的项目,这篇论文就挺值得一看。讲得比较细,思路也比较清晰。重点是,它没有绕的数学公式,读起来还挺顺。
而且里面提到的优化策略,也能应用在类似的Apriori或多层关联里,大数据的时候还能顺带优化一下性能,效率也能提上去。实操性还不错。
建议你顺便看看这些相关文章:像Apriori 算法那篇就讲得挺清楚的,还有Hash Tree 优化的思路也蛮实用,是在
数据挖掘
0
2025-06-18