基于模糊等价类的频繁项集精简表示方法研究

基于有向项集图的最大频繁项集挖掘算法

本算法基于有向项集图存储事务数据库中频繁项集信息，采用三叉链表结构组织有向项集图，并在此基础上提出最大频繁项集挖掘算法。该算法一次扫描事务数据库，有效减少I/O开销，适用于稀疏和稠密数据库的最大频繁项集挖掘。

数据挖掘 16 2024-05-31

Apriori基于MapReduce的频繁项集挖掘

基于 MapReduce 的 Apriori 算法代码，用 Hadoop 干了件挺实用的事儿——并行挖频繁项集。Apriori 都知道，老牌的关联规则算法了，逻辑不复杂但跑起来慢，尤其数据一大就吃不消。这个实现把它拆成Mapper和Reducer，分布式并行跑，效率高不少。你只要关注两块：第一轮用AprioriPass1Mapper把事务里的每个项都拎出来，频次都设成 1；后面AprioriReducer再来聚合，搞清楚哪些项是“热门款”。逻辑清晰，结构也干净。

Hadoop 0 2025-06-16

并行频繁项集挖掘算法的优化研究

传统的挖掘频繁项集的并行算法存在节点间负载不均衡、同步开销过大、通信量大等问题。针对这些挑战，提出了一种名为多次传送重新分配数据的并行算法（MRPD）。在MRPD算法中，第l步将数据库重新划分成多个组，并根据各节点的需求多次传送这些组。各节点在异步地计算完整组后，可以得到所有频繁项集。理论分析和实验结果均表明，MRPD算法在优化并行频繁项集挖掘中具有显著效果。

数据挖掘 16 2024-07-16

Apriori频繁项集挖掘算法

Apriori 算法在挖掘频繁项集和关联规则这块儿，算是老牌选手了，逻辑简单，思路清晰，最适合刚接触数据挖掘的你。规则一条条挖，速度还能接受，配合剪枝优化，用起来也挺顺手的。交易数据的商品组合推荐、购物车这些场景，Apriori 都能搞定。比如你想知道“买牛奶的人会不会顺便买面包”，那这算法就派上用场了。可以配合 Java 写个小项目，跑起来还挺快。文档我整理了几个链接，建议先看这个 Apriori 关联规则挖掘算法，基础讲得清楚。再瞄一眼Apriori 算法详解，讲得更深入。你要是关心性能问题，推荐你看看这个高效剪枝的版本，思路蛮实用的。还有 Java 版的示例项目哦，点这里Java

数据挖掘 0 2025-06-25

基于Vague集的模糊聚类方法研究2008

Vague 集的相似度量方法，挺适合搞不确定数据的朋友。作者张文彬和余建坤在这篇 2008 年的老论文里，用了不少数学工具把 Vague 集用在模糊聚类上，关键点就是一个字：稳！对你来说，如果平时要模糊、难分的数据，比如用户行为、图像识别啥的，这个方法还挺有意思的，尤其是 Vague 集那套距离计算，思路清晰，公式也不复杂。蛮适合做二次开发或模型优化参考的。

数据挖掘 0 2025-06-29

基于有序FP-tree的最大频繁项集挖掘

基于有序FP-tree的最大频繁项集挖掘概念提出: 完全前缀路径、有序FP-tree 有序FP-tree构建: 根据数据项所在层级建立数据表示: 利用有序FP-tree表示数据算法提出: MFIM算法，利用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘算法优化: 利用完全前缀路径对挖掘算法进行优化实验结果: 对于浓密数据集中的长模式挖掘具有良好性能

数据挖掘 18 2024-05-25

Apriori算法Java频繁项集挖掘

Apriori 算法的 Java 源码，写得挺清楚，逻辑也比较易懂。适合你拿来跑个 demo 或者改成自己的逻辑直接上项目。源码里用的是频繁项集的经典思路，多次扫描数据，算支持度，再生成关联规则。没有堆一堆公式，反倒更容易入门。 Apriori 算法是搞关联绕不开的东西，像电商里的“买了 A 也买 B”，就是这类场景。代码结构比较简洁，核心逻辑就几个类，调试起来也方便。你只要稍微会点 Java，改改就能用。源码里面有个简单例子，流程清晰，跑起来就能看到频繁项集和对应的关联规则。对比那些动不动就讲算法推导的教程，嗯，这份源码友好多了。另外还有不少参考资源，如果你想深入看看别的实现方式，像支持

算法与数据结构 0 2025-07-02

数据挖掘论文研究基于FP-Tree的新型频繁项集挖掘算法

在数据挖掘领域，发现频繁项集是关键问题之一。提出了一种名为FP-SPMA的新型算法，基于FP-Tree结构，通过共享前缀和前瞻剪枝，显著提升了算法效率。相较于传统方法，该算法无需递归构造条件模式树，有效压缩了事务数据库。

数据挖掘 11 2024-07-17

基于频繁项集的时态数据挖掘算法2003年

频繁项集的挖掘一直是数据里的大热门，尤其是在时态数据时。这篇文章研究了一个挺实用的算法，通过结合频繁项集和时态约束来挖掘关联规则。这种方法适合用在商品销售、股票价格预测等领域。而且，文章还贴心地给了一个股票数据的实际案例，感觉接地气。如果你对频繁项集或者关联规则感兴趣，这绝对值得一读！

数据挖掘 0 2025-06-16