我是一名本科生,发现计算机视觉很有趣。计算机视觉新手应该从哪里开始?
看看书 计算机视觉:算法与应用,第二版。 它是免费提供的。 作者Richard Szeliski是计算机视觉领域的知名研究员。他也是 Photosynth 项目的幕后推手。
把手弄脏!你用什么语言编程?我建议您查看 OpenCV,它是一个开源库,提供了许多可用于构建有趣系统的函数。它是为 C++ 编写的,但也有针对 Python 的绑定。它附带了许多演示,您可以立即运行并进行修改。
要完整了解该领域的书籍是最好的方法。
对于您想了解更多的任何特定主题,通过 Google Scholar 找到的调查论文都是不错的选择。
对于最新的研究,请查看 CVPR(视觉会议)的论文:
你肯定需要扎实的数学背景:微积分、线性代数、信号处理、概率和统计学。
您还需要了解计算机视觉研究的具体问题:识别特定物体的图像、识别一般类别的物体(“汽车”)、检测图像中是否存在物体、在图像中定位物体图像、跟踪视频中的移动对象、从图像或一组图像重建 3D 对象或场景等。
一位教授曾经告诉我进入新领域的好方法。去图书馆,找到该领域的主要期刊,然后开始阅读论文摘要,直到掌握术语。就计算机视觉而言,值得关注的期刊有 IEEE Transations of Pattern Analysis and Machine Intelligence(又名 PAMI)和 International Journal of Computer Vision(又名 IJCV)。顺便说一下,计算机视觉领域的两大会议是CVPR(IEEE计算机视觉与模式识别国际会议)和ICCV(计算机视觉国际会议)。
与视觉相关或严重重叠的主题是图像处理和机器学习。
如果您的学校提供计算机视觉课程,请参加。买一些关于我提到的主题的书。如果你住的地方附近有与视觉相关的会议,请溜进去看看海报。
哦,Matlab 是一个玩图像处理和视觉算法的绝佳环境。
一些资源:
与学校里的所有其他事情一样......从学习一门包含大量项目工作的课程开始。在您感兴趣的项目中探索想法并实施算法。像往常一样,维基百科是一个很好的初学者资源。如果您想要书籍,最受欢迎的书籍是:
但我建议你在开始读书之前,先在排名前十的大学之一或通过 iTunesU 参加一门课程/浏览一些课程幻灯片。
我发现本指南非常适合向新手介绍计算机视觉,但您确实需要获得硕士学位。电气和计算机工程系根据数字信号处理计划提供该课程,您可以从中选择专门研究机器视觉或数字成像(无论他们如何称呼它)。