互联网平台提供的用户信息授权服务已广泛应用,但在满足第三方网站的数据挖掘需求时,常将用户隐私信息存储在多方,增加了用户隐私滥用和泄露的风险。针对此问题,本研究提出了一种开放平台与网站间的分布式关联规则挖掘算法。该算法无需依赖可信的第三方参与,开放平台和网站各自根据挖掘条件生成布尔型矩阵,以频繁-1项集编号和用户身份标志符为行列标记。开放平台对矩阵进行扰动和整合,网站在整合后的矩阵上挖掘全局关联规则。实验证明,该算法有效且未因通信代价显著降低挖掘效率。
研究报告-面向互联网平台用户隐私保护的分布式关联规则挖掘算法.pdf
相关推荐
基于 CanTree 的分布式关联规则挖掘与增量更新算法研究
关联规则挖掘是数据挖掘领域的核心任务之一。近年来,随着数据规模不断扩大,分布式数据库架构以及数据动态变化的特性对关联规则挖掘算法提出了更高的要求。本研究聚焦于 CanTree 数据结构,提出一种高效的分布式关联规则挖掘算法,并设计相应的增量更新机制以适应动态变化的数据环境。
数据挖掘
15
2024-05-25
论文研究面向企业信用评估的分布式隐私保护数据挖掘
模糊数学的医学诊断模型,用 VB 语言开发的那种,还挺实用的。专门针对急性脑梗塞,能根据临床数据做出分型判断。你要是做和医学相关的数据挖掘,这个思路可以借鉴下,尤其是在隐私保护和分布式计算方面,蛮有启发。
数据挖掘
0
2025-06-17
分布式环境下Paillier同态加密的关联规则挖掘
在隐私保护数据挖掘领域,如何在保障数据安全性的前提下,不损失挖掘精度一直是一项挑战。为解决这一问题,我们提出了一种基于Paillier同态加密的关联规则挖掘方法,该方法适用于分布式环境。
方法特点:
计算与解密分离: 采用计算方和解密方分离的策略,有效保障数据挖掘过程的安全性。
精度无损: 利用同态加密特性,在不解密数据的情况下进行计算,确保挖掘精度不受影响。
效率提升: 引入蒙哥马利算法优化Paillier算法,降低计算开销,保证算法效率。
实验结果表明,该方法在引入加解密过程后,整体开销依然处于可接受范围,验证了其在实际应用中的可行性。
数据挖掘
18
2024-05-24
关联规则挖掘的新算法研究
关联规则挖掘一直是数据挖掘中重要的内容之一。提出了DPCFP-growth算法,它是基于MSApirori算法,并采用了CFP-growth分而治之的策略,以弥补原算法的不足。与CFP-growth算法相比,DPCFP-growth算法有效地将大数据库分解为多个小的子数据库,从而提高了算法的运行效率。实验结果表明,DPCFP-growth算法在大型数据挖掘中具有优越性。
数据挖掘
17
2024-07-17
互联网+大数据时代的商业分析研究报告
这份文档是关于大数据入门的介绍,涵盖了数据整理、应用方法和加工技术。在互联网和大数据的背景下,这些信息对于商业决策具有重要意义。
算法与数据结构
15
2024-07-13
关联规则隐藏算法研究
关联规则挖掘算法里的规则隐藏,真的是个挺有意思的方向。OSA 算法算是比较实用的一个,思路也蛮灵活。它不是单纯砍掉规则,而是通过加点东西、设点限制,把支持度和置信度搞低一点,巧妙隐藏那些敏感的信息。
你要是平时接触数据挖掘,尤其是做那种要隐私数据的项目,这篇论文就挺值得一看。讲得比较细,思路也比较清晰。重点是,它没有绕的数学公式,读起来还挺顺。
而且里面提到的优化策略,也能应用在类似的Apriori或多层关联里,大数据的时候还能顺带优化一下性能,效率也能提上去。实操性还不错。
建议你顺便看看这些相关文章:像Apriori 算法那篇就讲得挺清楚的,还有Hash Tree 优化的思路也蛮实用,是在
数据挖掘
0
2025-06-18
影响互联网专车平台用户意愿的因素实证研究
随着互联网技术、移动支付技术和智能手机的普及,共享经济为新型经济形态的经营理念带来了快速发展,互联网专车作为其中一种形式逐步兴起。本研究以互联网专车平台为研究对象,在理性行为理论、创新扩散理论及服务业相关研究的基础上,结合技术接受模型(TAM)、理性行为理论的主观规范、创新扩散理论的兼容性特征以及现代服务业特点,将用户使用意愿作为因变量,使用态度作为中介变量,分析感知有用性、感知兼容性、感知价格、主观规范、异质性、即时性和结合性等自变量。通过构建结构方程模型并提出相关假设,设计量表并通过问卷调查获得322份有效数据。最终,利用SPSS进行统计分析和测量指标的信度与效度检验,并通过Amos验证结
统计分析
12
2024-09-18
数据挖掘中关联规则算法的研究
近年来,随着计算机技术的迅猛发展,信息技术得到了广泛的应用,数据挖掘技术作为一个新兴领域,其算法之一——关联规则算法,尤为活跃。关联规则算法能够有效处理大量数据和信息,通过从数据库中提取繁琐的项集,并建立这些项集之间的关联关系,从而挖掘出有价值的数据信息,满足不同领域的需求。深入研究了数据挖掘中关联规则算法的应用与发展。
数据挖掘
16
2024-09-14
时序关联规则挖掘算法研究Apriori算法与其应用
时序关联规则挖掘算法看起来有点复杂,但其实理解起来并不难。你可以把它看作是在大量数据中找出哪些事件有一起发生的过程。最经典的算法之一就是Apriori 算法。它通过扫描数据库,找到频繁项集,根据支持度和置信度生成关联规则。这些规则能你理解不同项之间的关系。Apriori 算法有两个关键点:一是通过“频繁项集”的性质来减少计算量,二是通过剪枝技术加速算法。比如在医疗数据中,使用 Apriori 算法可以挖掘出哪些症状经常一起出现,医生做出更精准的诊断。简单来说,Apriori 就是通过“计算-判断-优化”的方式来快速找出潜在的关联关系。如果你对数据挖掘感兴趣,使用 Apriori 算法还是蛮不错
数据挖掘
0
2025-06-17