我刚刚开始研究多视图立体视觉。
但是我无法理解差距和深度(视差图和深度图均可)。
你能给我直觉吗?
谢谢。
[在立体视觉中,由两个相机隔开一定距离的两个图像可用于获取现实世界中图像点的3d位置(x,y,z),即深度-z位置除了2d-x和y位置。
视差是在透视下投影到两个不同的相机时,同一3D点的图像位置的差异。
两个摄像机中可见的场景中的任何点都将被投影到两个图像中的一对图像点,称为共轭对。两点位置之间的位移称为disparity。
阅读更多here。
视差图/图像就是给定的图像,其中每个像素给出该3d点的视差。
depth(3d点的实际z位置)可以通过使用相应点的视差来计算,例如在简单的情况下,如下所示:
depth = (baseline * focal length) / disparity)
其中baseline
是摄像机的黑白距离。
通过获取每个像素的深度,您可以获得深度图/图像。
阅读更多here。