垃圾分类的数据集里,xml和txt格式的标注文件都给你配好了,图片和标注各有 1377 张,拿来就能训练,蛮省事的。
七大类标签里分得比较细,像是plastics就包括饮料瓶、泡沫、袋子这些常见的,glass那类也不只是玻璃瓶,灯泡、碎玻璃也算。这种细分类对训练模型精度提升还挺有的。
WPD(未破袋)分类我觉得挺有意思的,它不按材质来分,而是以“装在垃圾袋里”为标准——比如你看到一个塑料袋装了点剩饭,不标plastics
,而是标WPD
,这种场景数据还挺贴近现实的。
文件结构清晰,打开就能看到.xml
和.txt
标注,一般你用YOLO或Pascal VOC格式的模型都能对接。推荐直接丢进labelImg看看标注效果,调起来更直观。
如果你是做图像分类、目标检测相关方向的,这套数据比较适合初学和验证小模型。想扩充数据,也可以从它的同类资源拓展,比如这几个:
- 智能分类装置识别的四类垃圾数据集 - 更偏向场景实拍
- 垃圾分类查询文档 - 标准参考挺全的
哦对了,数据量虽然不大,但种类丰富,用来做 demo 展示或原型测试刚刚好。时注意下 WPD 的特殊定义,别误分了类。
如果你正好在训练垃圾分类模型,或者想测试一下模型在小数据集上的表现,这套资源可以先试起来。