纽约警方的交通事故数据集,还挺实用的。数据范围覆盖 2020 年 1 月到 8 月,记录了每一次碰撞的时间、地点、涉及的车辆和人员情况。字段也比较全,像CRASH DATE
、BOROUGH
、LATITUDE
这种常用字段一应俱全。用来做可视化或者训练个简单模型都挺顺手的。
适合干啥?比如你想做个事故热力图,这些经纬度数据就直接能用。或者想事故高发时段、不同街区的事故率,用CRASH TIME
和BOROUGH
这些字段就够了。字段中英文对照也清晰,起来不用太费劲。
嗯,数据格式是典型的结构化表格,适合直接拿来喂进Pandas或Excel。你也可以配合像Leaflet.js
这样的可视化库做地图展示,效果还蛮不错。
如果你想参考更多相关资源,可以看看这些:
- 交通事故中的数据挖掘技术应用,讲得比较接地气
- 【元胞自动机】基于 Matlab 的交通事故仿真,有源码,适合搞建模
- 纽约市警方投诉数据,结构也类似,做横向对比挺方便
如果你最近正好在研究城市交通安全、做事故可视化,或者搭建数据平台,这个数据集可以直接上手,不用清洗太多,拿来就用。