探讨了在联机数据挖掘系统中并行和增量聚类算法的应用,并提供了算法的伪码。实验结果显示,相较于传统的Apriori算法,联机增量聚类算法具有显著优势,同时验证了增量聚类算法及其在联机数据挖掘系统中的实际效用。
研究联机增量聚类算法的探索(2004年)
相关推荐
基于特征向量的动态增量聚类算法研究及设计(2012年)
在数据挖掘领域,聚类是处理数据初始阶段的重要方法。在动态系统中,随着新数据的不断增加,重新聚类既费时又浪费资源。首先介绍了聚类的基本概念和分类,然后提出了一种基于特征向量的增量聚类算法。该算法仅针对新增数据进行聚类,从而节省了大量资源和时间。通过实验比较了该算法与传统重新聚类方法在动态系统中处理新增数据的效果,验证了其可行性。
数据挖掘
7
2024-08-03
探索数据挖掘:聚类算法的比较研究
这份关于数据挖掘中聚类算法的比较研究论文,带你深入了解不同算法的优缺点和适用场景。
数据挖掘
15
2024-05-20
1990―2004年西南低涡活动的统计研究(2007年)
利用15年(1990年―2004年)的逐日天气图资料对西南低涡的生成和移动进行了详细的统计分析。结果显示,西南低涡的发生频次随季节变化显著,共统计出1038次,其中生命期超过1天的有262次。春、夏季节的发生频数较高,春季发生77次(占29.4%),夏季发生92次(占35.1%);秋、冬季节较少,秋季发生55次(占21.0%),冬季发生38次(占14.5%)。西南低涡主要生成于高原东南缘和四川盆地,其中高原东南缘是最主要的生成区。
统计分析
11
2024-07-15
探索WEKA中的聚类算法
WEKA中的聚类算法
WEKA是一款强大的数据挖掘工具,提供了丰富的聚类算法,用于在数据集中发现隐藏的模式和结构。
常用聚类算法
k-Means: 将数据划分为k个簇,每个簇由其中心点表示。
层次聚类:构建一个树状结构,表示数据点之间的层次关系。
EM算法:基于概率模型,用于发现数据中的潜在类别。
DBSCAN:基于密度的算法,用于识别具有不同密度和形状的簇。
聚类分析应用
客户细分: 将客户群体划分为不同的类别,以便进行 targeted marketing.
异常检测: 识别数据集中与整体模式不符的异常点。
图像分割: 将图像划分为不同的区域,以便进行图像分析和理解。
WEKA的优
数据挖掘
18
2024-05-15
研究论文-基于K-means的有限增量聚类算法及其k值探讨.pdf
基于K-means的有限增量聚类算法及k值研究,姚文心,卢志国,聚类算法在数据挖掘、模式识别和信息抽取等领域广泛应用。随着互联网技术的进步,数据呈现动态增长特性。探索如何有效聚类动态数据是当前研究的关键问题。
数据挖掘
12
2024-07-29
基于系统云灰色预测的数据挖掘方法研究(2004年)
探讨了系统云灰色预测模型的构建原理,并详细论证了其积分生成机制。进一步深入研究了解析预测公式的应用,特别结合数据库中“贫”信息和小样本序列数据的特征。通过实例分析,比较了解析预测与离散预测的效果,凸显了其简便、详尽和直观的优势。
数据挖掘
12
2024-07-31
Kmeans聚类算法改进研究.pdf
Kmeans算法在模式识别和数据挖掘等领域应用广泛。针对高维度数据聚类效果差的问题,李森林和蒋启明提出了一种改进方法。
数据挖掘
23
2024-04-30
聚类算法研究进展综述
总结聚类算法的研究现状及新进展
分析代表性算法的算法思想、关键技术和优缺点
对典型算法进行实验对比,分析不同数据集和算法的聚类情况
提出聚类分析的研究热点、难点和待解决问题
数据挖掘
21
2024-05-25
现代数据挖掘技术研究进展 (2004年)
数据挖掘是一个跨学科融合的新兴学科。介绍了数据挖掘的基础知识和相关概念,并详细讨论了传统统计学方法、神经网络、决策树、进化式程序设计、基于事例推理方法、遗传算法、非线性回归方法等数据挖掘的基本方法。同时总结了数据挖掘在各领域的应用,探讨了数据质量、信息可视化、大数据管理、信息分析人员技能等挑战,并展望了未来的研究方向。
数据挖掘
9
2024-07-18