高速公路事故多发路段的识别,其实用起来最头疼的就是数据太杂、不好归类。主成分和Q 型聚类组合起来,刚好了这个问题。你只要把三年内的事故数据丢进去,借助 SPSS 的聚类模块,几步操作就能把高风险路段筛出来,蛮适合交警系统或者交通岗试一试的。
欧氏距离当相似度指标,结合离差平方和法做聚类,起来直观、效率也高。尤其像主干道、隧道口、弯道密集区,挺容易就能被识别出来。做个页面展示也不难,用地图可视化挂上坐标点就行。
你要是刚好在做交通相关的系统,像事故预警
、危险路段推送
这种功能,这种法挺能用得上。而且文章还搭了几篇不错的资源,像这个:纽约交通事故数据集可视化专用,和这个:基于 Matlab 的交通事故仿真【含源码】,用起来会更顺手。
哦对了,如果你还没玩过 Matlab + SPSS 结合建模,建议先看下聚类算法的基础原理:聚类算法,不然你一头雾水。
如果你是做智慧交通
相关项目的,可以直接参考里面的流程,套自己的数据跑一遍试试,出来的结果还挺有指导性的。