聚类算法的总结类资源其实不少,但《聚类算法研究_孙吉贵.pdf》这篇文章还挺有参考价值的。里面把近年来比较火的聚类方法都梳理了一遍,像K-Means、DBSCAN、谱聚类这些常用的算法,都有详细。关键是,它不仅讲原理,还搭配实验,讲清楚了算法在不同数据集下的表现。对比做得蛮细,准确率、效率都有考虑。
从算法思想讲起,再到关键技术,讲优缺点,说实话,讲得挺透。你要是正好在搞数据挖掘或者图像聚类,拿这篇文章做入门或者查漏补缺都挺合适。尤其是对比那块,看完你基本就知道哪个算法适合自己的场景了。
还有一点蛮好的,作者选的实验数据都来自UCI那类公开库,比较有代表性。你可以用同样的数据复现实验,方便。对于想搞一搞聚类优化或者混合模型的同学来说,也能从中找点灵感。
如果你用Python或Matlab写聚类代码,文末推荐的资源别错过,有现成的实现。像Python 实现 K-Means 聚类算法和Matlab 实现 K-means 聚类算法,拿来直接跑一下,看结果和论文对不上,还是蛮有意思的。
,这篇文章挺适合做学习参考和算法选型,如果你最近在研究无监督学习或者要写个聚类模块,建议收藏一波。嗯,有理论有实验,讲得也不枯燥。