δ-开放集的聚类思路还蛮有意思的,尤其适合那种形状不规则、数据分布不太平均的复杂数据集。你只要输入一个δ值,它就能帮你把数据切得细致,还能自动识别噪声点,挺智能的。

不光能高维数据,在 Olivetti 人脸数据库上的表现也不错。比起那些只能球形簇的传统方法,比如 K-means,它更像是“拓扑流派”的聚类方式,玩法不一样。

哦对了,它还有个升级版,能搞定那种密度差别大的数据集。如果你平时喜欢玩模式识别、数据挖掘、聚类这一类的算法实验,可以试试它,是在人脸、图像、或者非结构化数据时。

有需要的话,下面这些资源你也可以顺手看看,有代码也有讲义,挺全的:

如果你正好在折腾人脸识别或者模式识别那一块,这个聚类方法会挺帮得上忙的,尤其是在杂乱无章的数据时更显优势。