聚类基准数据信息-数据集挺适合做聚类研究,尤其是像你这种做数据的,应该会觉得蛮实用。它包含了 5000 个向量和 15 个高斯聚类,重叠度刚好合适,能让你比较精准地测试聚类算法的效果。如果你对高斯混合模型什么的有兴趣,肯定会觉得它有价值。对了,里面的数据集是二维的,挺容易上手的。如果你正在找这样的数据集,应该是挺不错的选择。
此外,如果你在使用过程中有些技术上的需求,这里有不少相关的资源可以参考。比如,Matlab 开发自定义二维高斯生成,或者你可以试试Matlab
中的二维混合高斯分布的期望最大化算法
,这些都可以你更好地进行数据。更多资源可以参考后面的相关链接,都会对你进一步的研究有所。