密集式SIFT和HoG的区别是什么?

问题描述 投票:10回答:1

我是计算机视觉的新手。我正在研究密集SIFT和HOG。对于密集SIFT,算法只是将每个点视为一个有趣的点,并计算其梯度向量。HOG是用梯度向量描述图像的另一种方式。

我认为密集SIFT是HOG的一个特殊情况。在HoG中,如果我们将bin大小设置为8,每个窗口有4个块,每个块有4个单元,块步长与块大小相同,我们仍然可以得到这个窗口的128个dim向量。而且我们可以设置任意的窗口跨度来滑动窗口来检测整个图像。如果这两种算法的窗口跨度相同,就可以得到相同的结果。

我不知道我说的是否正确。谁能帮帮我?

computer-vision sift
1个回答
9
投票

SIFT描述器选择一个16x16,然后把它分成4x4个窗口。在这4个窗口中的每一个窗口中,它计算出一个定向梯度的直方图。在计算这个直方图的同时,它还在相邻的角度之间进行插值。一旦你有了所有的4x4窗口,它就会使用一个窗口大小一半的高斯,以16x16块的中心为中心,对整个16x16描述符中的值进行加权。

而HoG则顾名思义只计算一个简单的定向梯度直方图。

我觉得SIFT由于涉及到高斯加权,更适合描述一个点的重要性,而HoG则没有这样的偏差。由于这个原因,(理想情况下)HoG应该比密集的SIFT更适合于图像的分类,如果所有的特征向量都连成一个巨大的向量的话(这是我的观点,可能不是真的)。

© www.soinside.com 2019 - 2024. All rights reserved.