决赛第二名的吸烟打电话检测项目,代码结构清爽,逻辑也挺清晰的。用的是比较经典的目标检测方法,针对视频帧做,还加了些后,适合做行为识别入门参考。
数据预做得比较扎实,训练和验证分得清楚,还附了不少标注样例。你直接跑train.py
就行,环境要求不复杂,Python 3.6+
配上常规的PyTorch
就能用。
嗯,模型是基于YOLO做了二次封装,适合细粒度检测场景,比如检测“抽烟动作”这种时序不稳定的事件。代码里还自带了一段视频剪辑+帧抽取的逻辑,挺贴心的。
哦对,推理部分封装得比较好,调用predict.py
就能直接出图,结果带框带标签,适合快速测试效果。想改成自己的数据集?改个路径、label 就能跑,适配性还不错。
如果你正在找视频行为检测的开源实现,又不想从头搭个数据管线,这份资源真的可以看看。省时间、省力,还挺实用的。