J.M. Santos 等人提出的 LEGClust 算法是一种基于分层熵子图的聚类算法,该算法已发表在 IEEE TPAMI(第 30 卷,第 1 期,2008 年,1-13 页)。MATLAB 代码可用于实现该算法。
基于分层熵子图的聚类算法:LEGClust
相关推荐
基于熵值法的Matlab代码词义聚类释义
基于保守值法的Matlab代码paraphrase_clustering此存储库包含用于按词义聚类释义的代码。如果您基于此代码或在工作中使用它,请引用以下文章: @ article { CocosAndCallisonBurch - 2016 : NAACL : ParaphraseClustering , author = { Anne Cocos and Chris Callison - Burch }, title = { Clustering Paraphrases by Word Sense }, booktitle = { Proceedings of the 15 th Annu
Matlab
15
2024-07-19
基于划分的聚类算法-K-prototypes算法
K-prototypes算法是结合了K-Means与K-modes算法,专门用于处理混合属性数据。它解决了数值属性和分类属性同时存在的情况。具体而言,数值属性通过K-means方法得到聚类中心P1,而分类属性则通过K-modes方法得到聚类中心P2。然后,通过加权组合这两个中心来计算距离度量D,权重a决定了分类属性在计算中的重要性。更新簇中心的方法结合了K-Means与K-modes的更新策略。
算法与数据结构
14
2024-07-13
基于DBSCAN算法的数据聚类技术
利用JAVA语言设计的面向对象的基于DBSCAN算法的数据分类技术,充分发挥其在数据处理中的优势和效果。
数据挖掘
11
2024-07-13
分层BLOG社区识别算法
基于博客数据的社区识别算法,该算法将博客视为一个分层结构,通过对博客文章的内容和链接关系分析,识别出社区。
数据挖掘
13
2024-05-23
基于加权不确定图数据的高效紧密子图挖掘算法
研究不确定图数据中的紧密子图挖掘问题,利用加权不确定图模型,以子图期望密度和顶点期望度数度量紧密程度。算法基于贪心迭代,优化执行过程,保证结果达到2近似比,并且确保高效率和正确性。研究还证明了带顶点限制的紧密子图挖掘问题的NP难度,该算法相比其他方法更快速高效。
数据挖掘
15
2024-07-21
基于最近邻规则的聚类算法实验
最近邻规则聚类算法的实验要求是编写一个使用欧式距离度量的聚类算法,可以设置阈值。通过在二维特征空间中验证,使用10个样本数据(如:x1 = (0,0),x2 = (3,8),x3 = (2,2),等)。这些实验探索最近邻规则在聚类过程中的应用。
Matlab
17
2024-08-23
基于密度树的网格快速聚类算法
该算法将网格原理应用于基于密度树的聚类算法,提高效率,降低I/O开销。
数据挖掘
15
2024-05-20
基于 K-子空间的聚类算法
K-子空间算法是一种聚类方法,其思路类似于 K-均值算法,都可以将数据划分到不同的簇中。
Matlab
11
2024-05-30
基于Spark的系统信息熵和条件熵计算
利用Spark计算CMIM、MRMR、MIFS等方法的开源库已经相当成熟。作者在仿照Spark MLlib库的特征选择功能基础上,扩展了支持系统信息熵和条件熵计算的方法。需要具体结果时,可直接调用ml.feature中相应的方法。
spark
11
2024-08-03