基于分层熵子图的聚类算法：LEGClust

Matlab 32

6.07KB 2024-05-31

#熵子图

J.M. Santos 等人提出的 LEGClust 算法是一种基于分层熵子图的聚类算法，该算法已发表在 IEEE TPAMI（第 30 卷，第 1 期，2008 年，1-13 页）。MATLAB 代码可用于实现该算法。

HierarchicalClustering分层聚类算法Java实现

分层聚类算法的实现真的挺，尤其是用 Java 来做。这个项目了一个基础的分层聚类实现，适合想快速入门数据挖掘的朋友。你可以看到代码中定义了数据点存储和距离矩阵计算的方式，这样就能方便地计算出所有数据点的聚类结果。最值得注意的是，算法使用了最小距离点的索引来计算聚类，直观。其实这也蛮适合初学者，理解起来比较容易。嗯，如果你想深入理解分层聚类的原理，也可以结合其他相关资源一块看。

数据挖掘 0 2025-06-24

基于熵值法的Matlab代码词义聚类释义

基于保守值法的Matlab代码paraphrase_clustering此存储库包含用于按词义聚类释义的代码。如果您基于此代码或在工作中使用它，请引用以下文章： @ article { CocosAndCallisonBurch - 2016 : NAACL : ParaphraseClustering , author = { Anne Cocos and Chris Callison - Burch }, title = { Clustering Paraphrases by Word Sense }, booktitle = { Proceedings of the 15 th Annu

Matlab 15 2024-07-19

基于划分的聚类算法

聚类的划分算法挺适合入门选手上手的，思路清晰，操作也不复杂。把一堆数据分成几个‘圈子’，圈内的像，圈外的不像，听起来就像是在组织社群，对吧？而且它是无监督学习，不需要你事先告诉它分类标准，比较省心。划分型的聚类方法，比如K-Means，其实用起来还蛮顺的。数据维度别太高、差异别太模糊，用起来效果还不错。你只要告诉它你想分几类，它就自己帮你动手分好。做图像？可以参考下这篇图像相似性评估；搞Python？推荐你看看Python 相似性度量的完整实现，代码清晰，图解直观。还有一个建议哦：如果你是初学者，不妨先在WEKA里拖拖点点试试，像这篇关于无监督聚类的小技巧就挺实用的。熟悉流程后再去写代码

算法与数据结构 0 2025-07-05

基于拓扑聚类的密度聚类算法研究

基于密度的聚类算法不少，像你平时用的 DBSCAN 啦，密度峰值聚类啦，都挺经典的。但说实话，这篇《基于拓扑聚类的密度聚类算法研究》把它们背后的概念整合得还挺清楚的。拓扑结构的思路其实蛮有意思，把簇看作一种“连通”的结构，挺像用图做聚类时的感觉。对老 DBSCAN 用户来说，能换个视角重新理解密度连通，嗯，挺值的。文章里还提了个新算法，用拓扑改进密度聚类，理论上说效果比传统 DBSCAN 更稳，对一些边界模糊的簇聚得还不错。代码细节没展开说太多，但思路清晰，有兴趣的你可以顺手看看配套的源码资源，像这个密度峰值聚类算法源码或 Python GUI 版，都还蛮实用的。如果你之前用密度类聚类感

数据挖掘 0 2025-07-01

基于划分的聚类算法-K-prototypes算法

K-prototypes算法是结合了K-Means与K-modes算法，专门用于处理混合属性数据。它解决了数值属性和分类属性同时存在的情况。具体而言，数值属性通过K-means方法得到聚类中心P1，而分类属性则通过K-modes方法得到聚类中心P2。然后，通过加权组合这两个中心来计算距离度量D，权重a决定了分类属性在计算中的重要性。更新簇中心的方法结合了K-Means与K-modes的更新策略。

算法与数据结构 14 2024-07-13

基于DBSCAN算法的数据聚类技术

利用JAVA语言设计的面向对象的基于DBSCAN算法的数据分类技术，充分发挥其在数据处理中的优势和效果。

数据挖掘 11 2024-07-13

基于网格密度的聚类算法研究

主要了基于网格密度的聚类算法，了传统聚类算法在数据时的速度慢和边界模糊问题。其实，随着数据量的不断增加，能快速有效地对数据进行划分变得重要。这种算法通过网格的方式提高了数据效率，适合在数据量大、维度高的场景下使用。你可以用它来优化数据速度，避免传统聚类方法的瓶颈。推荐学习下相关的密度聚类算法，比如DBSCAN、密度峰值聚类等，掌握了这些可以帮你更好地复杂数据集哦！

数据挖掘 0 2025-07-01

分层BLOG社区识别算法

基于博客数据的社区识别算法，该算法将博客视为一个分层结构，通过对博客文章的内容和链接关系分析，识别出社区。

数据挖掘 13 2024-05-23

基于加权不确定图数据的高效紧密子图挖掘算法

研究不确定图数据中的紧密子图挖掘问题，利用加权不确定图模型，以子图期望密度和顶点期望度数度量紧密程度。算法基于贪心迭代，优化执行过程，保证结果达到2近似比，并且确保高效率和正确性。研究还证明了带顶点限制的紧密子图挖掘问题的NP难度，该算法相比其他方法更快速高效。

数据挖掘 15 2024-07-21