不确定数据的可视化一直挺烧脑的,尤其是那种来自位置数据库、传感器的数据,误差大不说,波动还频繁。余志文这篇论文就给了个还挺有意思的解法:直接上了一个不确定自组织映射(USOM)的神经网络模型,结合了自组织映射(SOM)和模糊距离函数,专门搞定这类“不靠谱”的数据。
自组织映射你听过,类似在高维数据里建个二维小地图,什么分布、聚类,一眼就能看出个。现在配合模糊距离,用概率的方式不确定数据,USOM 就能把这些“模糊”的点有效归类,结果在低维网格上可视化,嗯,直观多了。
论文还用最小生成树(MST)把这些网格神经元聚合成更大类群,逻辑清晰,也不复杂。举个例子,比如你想研究移动设备用户的分布行为,这些位置信息不是精确坐标,而是范围模糊的区域,USOM 在这场景下就好用。
想试一试的话,建议你先看看这几篇相关资源:
如果你经常和不确定数据打交道,或者搞地图可视化、智能相关的项目,这个模型值得你好好玩玩,matlab 里试试也挺方便的。