基于密度的聚类算法不少,像你平时用的 DBSCAN 啦,密度峰值聚类 啦,都挺经典的。但说实话,这篇《基于拓扑聚类的密度聚类算法研究》把它们背后的概念整合得还挺清楚的。

拓扑结构的思路其实蛮有意思,把簇看作一种“连通”的结构,挺像用图做聚类时的感觉。对老 DBSCAN 用户来说,能换个视角重新理解密度连通,嗯,挺值的。

文章里还提了个新算法,用拓扑改进密度聚类,理论上说效果比传统 DBSCAN 更稳,对一些边界模糊的簇聚得还不错。代码细节没展开说太多,但思路清晰,有兴趣的你可以顺手看看配套的源码资源,像这个 密度峰值聚类算法源码Python GUI 版,都还蛮实用的。

如果你之前用密度类聚类感觉调参麻烦、边界模糊,这篇文章的拓扑视角说不定会给你点灵感。想试试进阶玩法的你,可以关注下 SA2DBSCAN 这类自适应方法,也挺香。