WEKA 的Apriori
算法挺实用的,适合做关联规则挖掘。通过Apriori
算法,你可以轻松找出数据之间的关系,像超市购物数据或者是用户行为这些都能用上。参数配置也挺直观,像-I
输出项集、-N 10
设置规则数为 10,这些都可以根据需要调整。如果你对关联规则挖掘有点兴趣,可以尝试下这个算法。是-C 0.9
这个最小置信度设置,挺有用的,能帮你提高挖掘质量。不过,记得根据数据的不同调整-M
和-U
这些支持度参数哦。,WEKA 的Apriori
算法在数据挖掘中还蛮受欢迎的,配置简单,效果也不错。
WEKA关联规则挖掘教程
相关推荐
关联规则观察-WEKA教程
在WEKA中观察关联规则,以发现项目集之间的联系和依赖关系。
Hadoop
13
2024-05-12
Weka关联规则挖掘参数设置实战
Weka关联规则挖掘参数设置实战
任务一:高提升度关联规则
本任务目标是挖掘支持度在10%到100%之间,提升度超过1.5且排名前100的关联规则。参数设置:lowerBoundMinSupport: 0.1upperBoundMinSupport: 1metricType: liftminMetric: 1.5numRules*: 100
任务二:高置信度分类关联规则
本任务目标是挖掘支持度在10%到100%之间,针对“car”属性,置信度超过0.8且排名前100的分类关联规则。参数设置:car: TruemetricType: confidenceminMetric: 0.8numRule
数据挖掘
24
2024-04-29
挖掘多层关联规则
挖掘多层关联规则可找出层次化的关联规则,例如:
牛奶 → 面包 [20%, 60%]
酸奶 → 黄面包 [6%, 50%]
数据挖掘
24
2024-05-25
Weka关联规则功能解析
Weka关联规则功能解析
在Weka中,关联规则以“L->R”的形式表达,其中L和R分别代表规则的前件和后件。
支持度(support): 指在一个购物篮中同时观察到L和R的概率,用P(L,R)表示。
置信度(conviction): 指购物栏中出现了L时也出会现R的条件概率,用P(R|L)表示。
关联规则的目标是生成支持度和置信度都较高的规则。除了置信度,还可以使用以下指标来衡量规则的关联程度:
Lift: P(L,R)/(P(L)P(R))
Leverage: P(L,R)-P(L)P(R)
Conviction: P(L)P(!R)/P(L,!R)
数据挖掘
15
2024-05-16
关联规则挖掘综述
关联规则挖掘该研究概述了关联规则挖掘技术的定义、分类、挖掘方法和模式。分析了关联规则挖掘质量的改善问题和领域应用。
数据挖掘
16
2024-05-19
加权负关联规则挖掘
针对传统关联规则挖掘算法不能有效挖掘负关联规则的问题,该研究引入了负关联的理论,并提出了新的算法。
DB2
11
2024-04-30
关联规则和动态关联规则简介
本内容适合于数据挖掘方向的硕士研究生阅读学习,对关联规则与动态关联规则做了简介。
数据挖掘
12
2024-04-30
数据挖掘 - 关联规则挖掘
本节讨论关联挖掘的基本概念、算法和应用。关联规则挖掘是一种发现频繁模式和强关联关系的技术,广泛应用于零售、金融和医疗等领域。
数据挖掘
12
2024-05-31
关联规则挖掘示例解析
以关联规则 A C 为例,深入解读其支持度和置信度:
支持度 (Support): 衡量规则 A C 在所有交易中出现的频率。
计算公式:support(A C) = support({A, C}) = 50%
解读:意味着在所有交易中,同时包含 A 和 C 的交易占 50%。
置信度 (Confidence): 衡量在包含 A 的交易中,也包含 C 的交易的比例。
计算公式:confidence(A C) = support({A, C}) / support({A}) = 66.6%
解读:意味着在所有包含 A 的交易中,有 66.6% 的交易也包含 C。
A
算法与数据结构
10
2024-05-23