谱系聚类的灵活分组方式,综合国力时还挺好用的。层层往下分,逻辑清晰,也方便后续。是数据比较杂、维度多的时候,用谱系聚类来做预,还挺省事。
谱系聚类的算法选项多,像凝聚法、分裂法都能上,跑个 karate
数据集,几行代码就能看出效果,挺直观的。嗯,适合新手理解,也能满足老鸟的需求。
这类聚类方式对粗糙集效果还不错,尤其在数据挖掘场景下,不是干净的数据,用它来离散化再做下一步操作,响应也快,准确率也稳得住。
对谱系聚类感兴趣的话,可以顺便看看《探究层次聚类》这篇,讲得蛮通俗的;还可以试试《karate 数据集的聚类》,有实战代码。
如果你平时要结构复杂的数据,可以优先考虑谱系聚类,预起来更省心。记得,聚类层数别太多,容易过拟合;聚类前最好归一化,结果会更稳。