J.M. Santos 等人提出的 LEGClust 算法是一种基于分层熵子图的聚类算法,该算法已发表在 IEEE TPAMI(第 30 卷,第 1 期,2008 年,1-13 页)。MATLAB 代码可用于实现该算法。
基于分层熵子图的聚类算法:LEGClust
相关推荐
HierarchicalClustering分层聚类算法Java实现
分层聚类算法的实现真的挺,尤其是用 Java 来做。这个项目了一个基础的分层聚类实现,适合想快速入门数据挖掘的朋友。你可以看到代码中定义了数据点存储和距离矩阵计算的方式,这样就能方便地计算出所有数据点的聚类结果。最值得注意的是,算法使用了最小距离点的索引来计算聚类,直观。其实这也蛮适合初学者,理解起来比较容易。嗯,如果你想深入理解分层聚类的原理,也可以结合其他相关资源一块看。
数据挖掘
0
2025-06-24
基于熵值法的Matlab代码词义聚类释义
基于保守值法的Matlab代码paraphrase_clustering此存储库包含用于按词义聚类释义的代码。如果您基于此代码或在工作中使用它,请引用以下文章: @ article { CocosAndCallisonBurch - 2016 : NAACL : ParaphraseClustering , author = { Anne Cocos and Chris Callison - Burch }, title = { Clustering Paraphrases by Word Sense }, booktitle = { Proceedings of the 15 th Annu
Matlab
15
2024-07-19
基于划分的聚类算法
聚类的划分算法挺适合入门选手上手的,思路清晰,操作也不复杂。把一堆数据分成几个‘圈子’,圈内的像,圈外的不像,听起来就像是在组织社群,对吧?而且它是无监督学习,不需要你事先告诉它分类标准,比较省心。
划分型的聚类方法,比如K-Means,其实用起来还蛮顺的。数据维度别太高、差异别太模糊,用起来效果还不错。你只要告诉它你想分几类,它就自己帮你动手分好。
做图像?可以参考下这篇图像相似性评估;搞Python?推荐你看看Python 相似性度量的完整实现,代码清晰,图解直观。
还有一个建议哦:如果你是初学者,不妨先在WEKA里拖拖点点试试,像这篇关于无监督聚类的小技巧就挺实用的。熟悉流程后再去写代码
算法与数据结构
0
2025-07-05
基于拓扑聚类的密度聚类算法研究
基于密度的聚类算法不少,像你平时用的 DBSCAN 啦,密度峰值聚类 啦,都挺经典的。但说实话,这篇《基于拓扑聚类的密度聚类算法研究》把它们背后的概念整合得还挺清楚的。拓扑结构的思路其实蛮有意思,把簇看作一种“连通”的结构,挺像用图做聚类时的感觉。对老 DBSCAN 用户来说,能换个视角重新理解密度连通,嗯,挺值的。文章里还提了个新算法,用拓扑改进密度聚类,理论上说效果比传统 DBSCAN 更稳,对一些边界模糊的簇聚得还不错。代码细节没展开说太多,但思路清晰,有兴趣的你可以顺手看看配套的源码资源,像这个 密度峰值聚类算法源码 或 Python GUI 版,都还蛮实用的。如果你之前用密度类聚类感
数据挖掘
0
2025-07-01
基于划分的聚类算法-K-prototypes算法
K-prototypes算法是结合了K-Means与K-modes算法,专门用于处理混合属性数据。它解决了数值属性和分类属性同时存在的情况。具体而言,数值属性通过K-means方法得到聚类中心P1,而分类属性则通过K-modes方法得到聚类中心P2。然后,通过加权组合这两个中心来计算距离度量D,权重a决定了分类属性在计算中的重要性。更新簇中心的方法结合了K-Means与K-modes的更新策略。
算法与数据结构
14
2024-07-13
基于DBSCAN算法的数据聚类技术
利用JAVA语言设计的面向对象的基于DBSCAN算法的数据分类技术,充分发挥其在数据处理中的优势和效果。
数据挖掘
11
2024-07-13
基于网格密度的聚类算法研究
主要了基于网格密度的聚类算法,了传统聚类算法在数据时的速度慢和边界模糊问题。其实,随着数据量的不断增加,能快速有效地对数据进行划分变得重要。这种算法通过网格的方式提高了数据效率,适合在数据量大、维度高的场景下使用。你可以用它来优化数据速度,避免传统聚类方法的瓶颈。推荐学习下相关的密度聚类算法,比如DBSCAN、密度峰值聚类等,掌握了这些可以帮你更好地复杂数据集哦!
数据挖掘
0
2025-07-01
分层BLOG社区识别算法
基于博客数据的社区识别算法,该算法将博客视为一个分层结构,通过对博客文章的内容和链接关系分析,识别出社区。
数据挖掘
13
2024-05-23
基于加权不确定图数据的高效紧密子图挖掘算法
研究不确定图数据中的紧密子图挖掘问题,利用加权不确定图模型,以子图期望密度和顶点期望度数度量紧密程度。算法基于贪心迭代,优化执行过程,保证结果达到2近似比,并且确保高效率和正确性。研究还证明了带顶点限制的紧密子图挖掘问题的NP难度,该算法相比其他方法更快速高效。
数据挖掘
15
2024-07-21