保存聚类结果的操作,在用 WEKA 做完聚类后还挺关键的。尤其你要复用结果或后续做可视化,最好一步到位。WEKA默认只在控制台里输出结果,其实可以通过点几下菜单把聚类结果导出来,格式还比较多,像.arff.csv都行,拿来喂别的模型也方便。

菜单栏的Cluster里,先设置好模型,再在“Result list”里右键聚类结果,选“Save result buffer”,就能保存了。保存的是类似控制台的文字结果,如果你想导出带标签的数据集,还得勾选“Output cluster assignments”。嗯,挺容易漏这个选项的,注意一下哦。

再进阶一点,可以搭配一些工具做可视化,比如你可以看看WEKA 聚类结果可视化教程,讲得蛮细的。或者你对 K-means 感兴趣,也可以参考Java 与 Python 实现 K-means 聚类算法结果对比,有助于你更清楚算法表现。

如果你常用 WEKA 做聚类,建议顺手把结果保存下来,尤其是做实验的时候。以后要回头,少多麻烦。