这个项目结合了数据挖掘和交通事故数据,合作伙伴包括乔治·华盛顿大学的贾法里教授和两位队友。项目依赖的两个 csv 文件Crashes_in_DC.csvCrash_Details_Table.csv包含了大量的哥伦比亚特区交通事故数据。数据源来自多个官方部门,整合后为了深入的基础。你可以用这份数据来练习数据挖掘技巧,挖掘交通事故背后的规律,挺有挑战的。项目涉及的技术栈包括数据清理、探索性数据(EDA)、以及基本的机器学习。python在这个项目中适用,尤其是用到的库如pandasmatplotlib。如果你想更深入理解数据如何被并应用到实际中,这个项目会是个不错的起点。