基于有向图的聚类算法优化使用Koontz等人的方法在数据集中发现聚类

基于拓扑聚类的密度聚类算法研究

基于密度的聚类算法不少，像你平时用的 DBSCAN 啦，密度峰值聚类啦，都挺经典的。但说实话，这篇《基于拓扑聚类的密度聚类算法研究》把它们背后的概念整合得还挺清楚的。拓扑结构的思路其实蛮有意思，把簇看作一种“连通”的结构，挺像用图做聚类时的感觉。对老 DBSCAN 用户来说，能换个视角重新理解密度连通，嗯，挺值的。文章里还提了个新算法，用拓扑改进密度聚类，理论上说效果比传统 DBSCAN 更稳，对一些边界模糊的簇聚得还不错。代码细节没展开说太多，但思路清晰，有兴趣的你可以顺手看看配套的源码资源，像这个密度峰值聚类算法源码或 Python GUI 版，都还蛮实用的。如果你之前用密度类聚类感

数据挖掘 0 2025-07-01

基于聚类的网络新闻热点发现方法研究

本研究探索基于聚类的网络新闻热点发现方法，通过结合层次聚类、K-means聚类和增量聚类算法，实现对大规模网络新闻数据中热点事件的快速准确发现。研究首先使用层次聚类对每天的新闻网页进行微类划分，接着通过K-means聚类对每月的微类进行进一步聚类，最后利用增量聚类算法对每年的事件进行整合，得出一年的热点新闻事件。系统流程包括新闻网页预处理、聚类算法设计和热点计算公式设计。实验表明，结合多种聚类算法的热点发现方法能够满足人们对网络新闻热点事件快速准确发现的需求。

算法与数据结构 11 2024-09-14

基于贝叶斯分类的聚类算法软聚类的新方法

介绍了一种新的软聚类算法，名为基于贝叶斯分类的聚类。该算法不需要随机初始化，而是利用本地度量来选择最佳的聚类数。通过最小化可以从软聚类分配中推导出的对数贝叶斯风险来执行聚类，这被视为聚类过程的优化目标函数。算法类似于期望最大化，最小化所提出的聚类功能。此外，该算法已实现CPU和GPU版本。

Matlab 11 2024-09-27

基于划分的聚类算法

聚类的划分算法挺适合入门选手上手的，思路清晰，操作也不复杂。把一堆数据分成几个‘圈子’，圈内的像，圈外的不像，听起来就像是在组织社群，对吧？而且它是无监督学习，不需要你事先告诉它分类标准，比较省心。划分型的聚类方法，比如K-Means，其实用起来还蛮顺的。数据维度别太高、差异别太模糊，用起来效果还不错。你只要告诉它你想分几类，它就自己帮你动手分好。做图像？可以参考下这篇图像相似性评估；搞Python？推荐你看看Python 相似性度量的完整实现，代码清晰，图解直观。还有一个建议哦：如果你是初学者，不妨先在WEKA里拖拖点点试试，像这篇关于无监督聚类的小技巧就挺实用的。熟悉流程后再去写代码

算法与数据结构 0 2025-07-05

基于DBSCAN算法的数据聚类技术

利用JAVA语言设计的面向对象的基于DBSCAN算法的数据分类技术，充分发挥其在数据处理中的优势和效果。

数据挖掘 11 2024-07-13

基于网格的聚类算法优化及其应用探讨

介绍了典型算法，如CLIQUE聚类算法和WaveCluster聚类算法等。在机器学习中，聚类算法是一种无监督分类算法，包括基于划分的聚类算法（如kmeans）、基于层次的聚类算法（如BIRCH）、基于密度的聚类算法（如DBScan）和基于网格的聚类算法。基于网格的方法能够更好地处理非凸形状的簇，并降低计算复杂度。STING算法采用多分辨率网格，通过层次结构将空间分割为不同大小的单元，查询算法通过比较每个单元格的属性值与查询条件，逐渐缩小范围，最终找到满足条件的簇。CLIQUE算法结合了密度和网格思想，能够发现任意形状的簇，并处理高维数据。WaveCluster算法使用小波分析改进了聚类边界检测

数据挖掘 7 2024-10-12

基于粒子群优化的聚类算法Matlab实现

该Matlab代码实现了基于粒子群优化（PSO）的聚类算法，其灵感来源于Van Der Merwe和Engelbrecht于2003年发表的论文“使用粒子群优化的数据聚类”。代码由Augusto Luis Ballardini编写，可以通过以下方式联系作者：* 邮箱：<邮箱地址>* 网站：<网站地址> 关于该PSO聚类算法实现的简短教程可以在这里找到：<教程链接>

Matlab 18 2024-05-25

优化后的BIRCH聚类算法

BIRCH算法是一种适用于大规模数据集的聚类算法，它通过构建具有统一阈值的聚类特征树（CF树）来实现。改进后的算法不仅能处理数值型数据，还能有效应对混合型属性数据集。我们通过启发式方法选择初始阈值，并提出了阈值在不同阶段的提升策略。此外，对算法参数进行了优化探讨，指出在特定条件下参数的选择对性能影响显著。实验证明，优化后的BIRCH算法在聚类效果上表现出色。

数据挖掘 10 2024-07-16

基于网格密度的聚类算法研究

主要了基于网格密度的聚类算法，了传统聚类算法在数据时的速度慢和边界模糊问题。其实，随着数据量的不断增加，能快速有效地对数据进行划分变得重要。这种算法通过网格的方式提高了数据效率，适合在数据量大、维度高的场景下使用。你可以用它来优化数据速度，避免传统聚类方法的瓶颈。推荐学习下相关的密度聚类算法，比如DBSCAN、密度峰值聚类等，掌握了这些可以帮你更好地复杂数据集哦！

数据挖掘 0 2025-07-01