我需要创建一个反向图像搜索引擎。 这个想法和谷歌图片一样,你放一张图片,引擎会返回最相似的图片。
我做了一些关于基于内容的图像检索的研究,并找到了实现这一结果的过程。
我对从图像中提取特征的技术有一些疑问。我找到了一些关于使用特征检测器(SIFT/SURF/ORB)的文档,以及其他关于使用 CNN 提取特征向量的文档。
最好的解决方案是什么? CNN 似乎更快更容易快速入门,但我自己没有训练 CNN 的硬件(我的数据库中可以有非常相似的图像)。
我想我总共会有10k-200k张图片。
索引提取的特征的好方法是什么?我查看了 Elasticsearch dense_vector 字段,看起来不错,但我担心内存需求。 (使用 Caltech101 数据集,索引是图像本身的两倍)
我还查看了 annoy、milvus 和 qdrant。哪个指标体系最好?