我有hundres /数千张图片的文件夹,其中一些看起来很相像。我想创建集群分离这些图像(那些看起来很像同一集群中的)。
我不能确定,将需要群集的数量,它取决于图像。有没有人对如何做到这一点使用Python,OpenCV的和使用的算法的想法?
我做了一些研究,发现AffinityPropagation或DBSCAN可以为我有用的,但我不知道从哪里开始(如何编码我的图片,我应该怎么传递给那些算法等)
遗憾的是它不与图像那么简单,因为天真的聚类会导致用相同的颜色,不一样的“内容”图像的集群。您可以使用神经网络作为图像的特征提取,我看到两个选项:
选项1是更便宜,因为你可以很容易地找到预先训练模式,选择2是更昂贵的计算,但应更好地工作,尤其是如果有您的域名没有预先训练模式。
This tutorial(在互联网上找到随机)似乎是一个很好的介绍方法2。