基于邻域系统的决策表压缩方法,挺适合搞医疗诊断这类数据量大又偏离散的场景。用代表元素代替一堆相似样本,数据量一下子就下来了,压缩还不影响决策力,挺实用的。尤其在数据预阶段,能省不少事,省内存、跑得快,效果也比传统聚类好点。嗯,写算法的人还专门做了模拟测试,稳。想搞医疗挖掘、做智能辅助诊断的你,不妨看一眼。