无监督聚类的删除类标号技巧,挺适合做特征抽取前的预,尤其你想丢掉已有标签让模型自己去发现结构。用的是WEKA这套老牌工具,界面操作上手快。你只需要把有标签的数据丢进去,选好聚类算法,比如EMSimpleKMeans,运行后就能把原来的类标忽略掉,得到一组纯聚类的结果,后面你拿它去做特征可视化也方便。

页面讲得还挺详细,步骤截图也清楚,新手照着做问题不大。如果你手上数据标签不靠谱,或者你本来就想试试模型自己分群的效果,这方法还挺值得一用。