我查看雅虎旧的NSFW探测器,不禁想知道是否有一个Yolo DNN
版本训练过类似(未发布)的数据集,可以检测和定位人体裸照在图片上?
是否至少有一个公共数据库,或者我必须自己收集?
最近的努力已经被整合在一起,以实现这种数据的刮刀。如this article所述,它产生了一个220k的图像数据集,你可以在this repo's /raw_data
folder找到它。
它可能对您有用,但该数据集具有非常通用和稀疏定义的类别,这启发了这个newer, better organized dataset。它有159个定义的类别,共有158万个imgur URL。这些主要来自Reddit频道,在Reddit的所有分类荣耀中,它们对标签的整体放置做出了贡献。回购邮件的README
声称在数据清理后 - 例如复制/损坏/删除数据删除 - 您的总卷应该有~500 GB和〜130万个图像。
至于预训练的YOLO,那里没有任何繁琐的工作。如果您对将内容过滤委派给Google的Cloud Vision API的依赖性和成本感到满意,那么他们就是claim to be good at classifying visual adult content。否则,由于大多数同样性质的作品似乎是私人的,你必须训练自己的。