随着技术的进步,商务智能和决策系统成功的关键在于从万维网上精选和应用高质量信息。万维网资源因其高动态性、高自主性、数据海量和多样化信息类型,以及不同应用需求等特点,面临着严峻的信息质量问题。国内外研究已开始关注万维网资源质量的挖掘。分析了商务智能等高级应用对Web资源和信息质量的需求,指出了Web资源质量带来的挑战,并综述了现有的Web资源质量模式发现与评估方法。进一步探讨了应用数据挖掘及相关技术来处理Web资源质量异常的原理,强调了Web资源质量挖掘领域亟需解决的问题和挑战。
基于万维网的资源质量模式挖掘技术分析 (2010)
相关推荐
频繁图模式挖掘质量管理过程分析
论文分析了频繁图模式挖掘的质量管理过程,探讨了影响质量的因素和管理策略。
数据挖掘
15
2024-05-01
XML在Web挖掘中的因果模式应用(2010年)
这篇文章定义了一种包括因果关系、因果集合、影响度和分类权值等参数的模式。结合统计分析和其他数据挖掘算法,利用XML的优势构建了一种Web挖掘模型。该模型不仅能够发现Web上事物之间的内在联系和规律,还能为任务执行提供预测和决策支持。实际应用证明,该模型有效可靠,对预测和决策具有重要作用。
数据挖掘
9
2024-07-16
数据挖掘:探索数据模式的技术
数据挖掘技术涵盖关联分析、分类、聚类、文本挖掘、Web 挖掘、图形挖掘以及流和时间序列挖掘等领域。通过学习数据挖掘,您可以:
掌握数据挖掘和知识发现(KDD)的过程。
分析不同数据挖掘和 KDD 算法的适用性。
设计算法解决分类、聚类问题,并从数据库中识别关联规则。
应用文本挖掘、Web 挖掘、图挖掘以及流和时间序列挖掘的概念和算法。
评估数据挖掘和 KDD 算法的性能,比较和对比不同算法的性能。
评估数据挖掘算法的可伸缩性。
分析影响数据挖掘效率的数据特征。
检查数据挖掘和 KDD 算法的局限性。
数据挖掘
18
2024-05-21
模式矩阵数据挖掘技术的新视角
模式矩阵通常采用矢量表示数据对象,每个矢量在多维空间中描述对象的多方面特征。每个维度代表一个特征,多个对象的矢量形成模式矩阵(Pattern Matrix),即(xij)mn。每行表示一个对象,每列描述一个特征。这种方法在数据挖掘中具有重要应用价值。
Hadoop
16
2024-07-15
基于GPS轨迹的周期模式挖掘方法探讨
针对周期行为挖掘中时空数据采样频率不确定、数据稀疏和时空数据噪声等问题,采用GMPF(GPS Multi-Periodic Find)算法探索用户的周期模式。该方法首先将用户轨迹序列转换为兴趣点集合,然后针对每个兴趣点进行周期挖掘。在微软亚洲研究院的Geolife项目中,利用182名用户4年的GPS数据进行了验证实验,证明了该方法的有效性,对数据噪声和稀疏性具有较好的适应性。
数据挖掘
15
2024-07-16
基于贝叶斯方法的序列模式挖掘
序列模式挖掘算法本算法结合贝叶斯学习,简化挖掘过程,可处理不完备、溢出及噪声数据。
概率模型使用概率论模型描述序列,并利用贝叶斯知识辅助。
算法性能经复杂度分析和性能验证,该算法具有优越性。
数据挖掘
18
2024-05-25
基于日志文件的数据挖掘技术分析与研究
数据挖掘的定义及其在分析日志数据挑战中的应用原因被介绍。讨论了企事业单位计算机信息系统安全的加强对日志数据挖掘的需求,并总结了具体应用。
数据挖掘
9
2024-07-17
网盘资源变更告知
已将yarn-tuning-guide (中文版)官方下载翻译为中文版本。
Hadoop
16
2024-05-15
基于元组ID传播的多关系频繁模式挖掘
传统的多关系数据挖掘算法通常依赖于物理连接操作, 这在处理大规模数据集时会导致效率低下。为了克服这一限制, 本研究提出了一种新的多关系频繁模式挖掘算法。
该算法的核心思想是利用元组ID传播机制, 在不进行物理连接的情况下, 直接从多个关系中挖掘频繁模式。通过这种方式, 算法可以显著减少计算量和内存消耗, 从而提高挖掘效率。
实验结果表明, 相比于传统的基于连接的方法, 本算法在处理多关系数据时具有更高的效率和可扩展性。
数据挖掘
17
2024-05-25