多视图数据的聚类,WTLR_MSC 这个项目真的蛮值得一看。它用的是加权张量来融合多视角信息,还加上了低秩约束,再配合谱聚类来提升准确率。简单说,就是把各个视图的信息整合在一起,还能自动判断哪个视图更靠谱,做出更聪明的聚类判断。
多模态数据场景,比如图像+文本、社交网络多维度数据之类,这套方法都比较合适。张量就是多个矩阵堆起来的那种数据结构,能把多维信息收好收满,代码里也有清晰的构建过程。
视图加权做得也挺实用,能根据数据质量自动给不同视角分配权重,挺聪明。不是所有的视图都一样有用嘛,权重搞对了,结果自然靠谱。
聚类部分用的是谱聚类,通过分解相似度矩阵提特征向量,适合那些形状奇怪的数据簇。流程也挺清楚:预 → 加权张量构建 → 低秩分解 → 相似度图 → 聚类
。
项目代码结构清晰,想法也前沿。适合研究类应用,也可以作为你自己搞多模态任务时的参考模版。Matlab 开发,运行也比较方便。
如果你手头有多视角的数据,不妨看看code-of-WTLR_MSC-main
,研究清楚这个套路,以后聚类任务会顺多。