四个模块配合得还挺默契的 matlab 版 kmeans,适合想快速上手聚类的你。getdatafromfile
能从文本文件里灵活读取指定数据,支持可变参数,起来比较灵活;tkmeans
是核心算法,结构清晰,逻辑也直白;测试用的tkmeansTest
可以直接运行,省去搭环境的麻烦;还有个writedata
,专门用来把矩阵数据写进文件,配合整个流程刚刚好。
支持的数据集还蛮常见的,像iris、glass、diabetes这些都可以直接用。适合你想自己调一下参数、测下精度的时候玩一玩。嗯,前提是你这边用的都是数值型数据哈,暂时不支持字符串啥的。
如果你对其他语言也感兴趣,可以顺手看看JAVA 实现的 kmeans或者Python 版的对比一下。不管是做个参考,还是想移植,思路都还挺通的。
建议你下载后先跑一遍tkmeansTest
,看看输出效果,熟悉一下每个函数的输入输出。哦对了,路径别写错,不然读文件会出错。
,如果你正好在用 matlab 做聚类,这套代码还挺顺手的,用起来也不重。