计算机视觉的实现基本过程-电子发烧友网

如果想要机器能够进行思考，我们需要先教会它们去看。

李飞飞——Director of Stanford AI Lab and Stanford Vision Lab

计算机视觉（Computer vision）是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图像处理，用计算机处理成更适合人眼观察或进行仪器检测的图像。

学习和运算能让机器能够更好的理解图片环境，并且建立具有真正智能的视觉系统。当下环境中存在着大量的图片和视频内容，这些内容亟需学者们理解并在其中找出模式，来揭示那些我们以前不曾注意过的细节。计算机视觉的实现基本过程为：

计算机从图片中生成数学模型

计算机图形在模型中对图像进行绘制，然后在图像处理过程中将其作为输入，另外给出处理图像作为输出

计算机视觉的理念在某些方面其实与很多概念有部分重叠，包括：人工智能、数字图像处理、机器学习、深度学习、模式识别、概率图模型、科学计算以及一系列的数学计算等。因此，你可以将本文看成是深入这个领域研究的第一步。本文将尽量包涵到尽可能多的内容，但是可能仍然会存在一些较为复杂的主题，也有可能存在某些遗漏之处，敬请见谅。

丨第一步——背景

通常来说，你应该具有一点相关的学术背景，比如上过有关概率学、统计学、线性代数、微积分（微分与积分）等相关课程，对矩阵计算有一定了解更好。另外，从我的经验来看如果你对数字信号处理有了解的话，在以后对于概念的理解来说会更加容易。
在实现层面来说，你最好能够会用MATLAB或者Python中的一种，一定要记住的是计算机视觉几乎全部与计算机编程有关。

你也可以在Coursera上选修《概率绘图模型》一课，这门课程相对较难（讲得比较深入），你也可以在学习一段时间之后再对其进行了解。

丨第二步——数字图像处理

观看来自杜克大学的Guillermo Sapiro所教授的课程——《图像和视频处理：从火星到好莱坞Image and Video Processing: From Mars to Hollywood with a Stop at the Hospital》，该课程所提供的教学大纲每章都是独立的且包涵大量的练习，你可以在coursera和YouTube上找到相关的课程视频信息。另外你可以看下Gonzalez与Woods编写的《数字图像处理（Digital Image Processing）》一书，使用MATLAB来运行其中所提到的范例，相信一定会有所获。

丨第三步——计算机视觉

一旦学习完有关数字图像处理有关内容，接下来应该了解相关的数学模型在各种图像和视频内容中的应用方法。来自佛罗里达大学的Mubarak Shah教授在计算机视觉方面的课程可以作为一门很好的入门课程，其涵盖了几乎所有的基础概念。

观看这些影片的同时，可以学习Gatech的James Hays教授的计算机视觉项目课程所使用的概念和算法，这些练习也都是基于MATLAB的。千万不要跳过这些练习，只有在真正的练习过程中才会对这些算法和公式有更深入的了解。

丨第四步——高级计算机视觉

如果你认真学习了前三步中的内容，现在可以进入到高级计算机视觉相关学习了。
来自巴黎中央理工学院的Nikos Paragios和Pawan Kumar讲授了一门人工视觉中的离散推理（Discrete Inference in Artificial Vision）课程，它能提供相关的概率图形模型和计算机视觉相关的大量数学知识。

到现在这一步来看就比较有趣了，这门课程一定能让你感受到用简单模型构筑机器视觉系统有多么复杂。学完这门课程的话，在接触学术论文之前又迈进一大步。

丨第五步——引入Python和开源框架

这一步我们要接触到Python编程语言。
就Python而言有许多像 OpenCV、PIL、vlfeat这样的相关扩展包，现在就是将这些扩展包运用到你的项目中的最好时机。因为如果有其他的开源框架存在的话，没有必要从头开始来编写一切内容。
如果需要参考资料的话可以考虑《使用Python对计算机视觉进行编程 Programming Computer Vision with Python》，使用这本书就够了。你可以动手去尝试下，看看MATLAB和Python结合的话如何来实现你的算法。

丨第六步——机器学习与CovNets（卷积神经网络）

有关如何从头开始机器学习的资料实在太多，你可以从在网上查找到大量相关教程。

从现在开始最好一直使用Python进行编程，可以看下《使用Python建立机器学习系统——Building Machine Learning Systems with Python》和《Python机器学习——Python Machine Learning》这两本书。
目前深度学习正大行其道，可以试着学习卷积神经网络在计算机视觉中的应用（ Computer Vision: the use of CovNets），在此推荐斯坦福的CS231n课程：针对视觉识别的卷积神经网络。

丨第七步——如何才能更进一步

行文至此，你可能会觉得已经讲了太多的内容，需要学的已经太多。但是，你还可以进一步进行探索研究。
其中一个方法是看看由多伦多大学的Sanja Fidler和James Hays所举行的一系列研讨会课程，能帮助你对当下计算机视觉研究方向的最新概念有所理解。
另一种即跟着 CVPR、ICCV、 ECCV、 BMVC这些顶级学术会议的相关学术论文，通过会上的研讨会、主旨演讲以及tutorial等日程一定能学到不少知识。

总结：如果你按照步骤一步步完成所有的学习任务，届时你将大概了解计算机视觉中有关滤波器、特征检测、描述、相机模型、追踪器的历史，另外还学习到分割和识别、神经网络和深度学习的最新进展。希望本文能帮助你在计算机视觉领域走得更远，学习得更加深入。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

图像处理

图像处理

+关注

关注
27

文章
1292

浏览量
56745
机器视觉

机器视觉

+关注

关注
162

文章
4372

浏览量
120313
计算机视觉

计算机视觉

+关注

关注
8

文章
1698

浏览量
45993

原文标题：从计算机视觉的小白变为大神，你需要经历这七个阶段

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

计算机视觉有哪些优缺点

计算机视觉作为人工智能领域的一个重要分支，旨在使计算机能够像人类一样理解和解释图像和视频中的信息。这一技术的发展不仅推动了多个行业的变革，也带来了诸多优势，但同时也伴随着一些挑战和局限性。以下是对

发表于 08-14 09:49 •949次阅读

计算机视觉技术的AI算法模型

计算机视觉技术作为人工智能领域的一个重要分支，旨在使计算机能够像人类一样理解和解释图像及视频中的信息。为了实现这一目标，计算机

发表于 07-24 12:46 •850次阅读

机器视觉和计算机视觉有什么区别

机器视觉和计算机视觉是两个密切相关但又有所区别的概念。一、定义机器视觉机器视觉，又称为计算机

发表于 07-16 10:23 •532次阅读

计算机视觉的五大技术

计算机视觉作为深度学习领域最热门的研究方向之一，其技术涵盖了多个方面，为人工智能的发展开拓了广阔的道路。以下是对计算机视觉五大技术的详细解析，包括图像分类、对象检测、目标跟踪、语义分割

发表于 07-10 18:26 •1366次阅读

计算机视觉的工作原理和应用

计算机视觉（Computer Vision，简称CV）是一门跨学科的研究领域，它利用计算机和数学算法来模拟人类视觉系统对图像和视频进行识别、理解、分析和处理。其核心目标在于使

发表于 07-10 18:24 •1973次阅读

计算机视觉与人工智能的关系是什么

、交流等方面。计算机视觉与人工智能之间存在着密切的联系，计算机视觉是人工智能的一个重要分支，也是实现人工智能的关键技术之一。

发表于 07-09 09:25 •649次阅读

计算机视觉与智能感知是干嘛的

引言 计算机视觉（Computer Vision）是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域，是人工智能的重要组成部分。智能

发表于 07-09 09:23 •938次阅读

计算机视觉和机器视觉区别在哪

，旨在实现对图像和视频的自动分析和理解。机器视觉机器视觉是计算机视觉的一个分支，主要应用于工业自动化领域。它利用

发表于 07-09 09:22 •454次阅读

计算机视觉和图像处理的区别和联系

数据的过程。计算机视觉的目标是使计算机能够像人类一样“看到”和理解图像或视频内容。 1.2 图像处理图像处理，也称为数字图像处理，是应用数学和计算

发表于 07-09 09:16 •1313次阅读

计算机视觉属于人工智能吗

和解释视觉信息，从而实现对图像和视频的自动分析和处理。 计算机视觉的基本概念 2.1 计算机视觉

发表于 07-09 09:11 •1305次阅读

深度学习在计算机视觉领域的应用

随着人工智能技术的飞速发展，深度学习作为其中的核心技术之一，已经在计算机视觉领域取得了显著的成果。计算机视觉，作为计算机科学的一个重要分支，

发表于 07-01 11:38 •806次阅读

机器视觉与计算机视觉的区别

在人工智能和自动化技术的快速发展中，机器视觉（Machine Vision, MV）和计算机视觉（Computer Vision, CV）作为两个重要的分支领域，都扮演着至关重要的角色。尽管它们在

发表于 06-06 17:24 •1333次阅读

计算机视觉的主要研究方向

计算机视觉（Computer Vision, CV）作为人工智能领域的一个重要分支，致力于使计算机能够像人眼一样理解和解释图像和视频中的信息。随着深度学习、大数据等技术的快速发展，计算机

发表于 06-06 17:17 •975次阅读

计算机视觉的十大算法

随着科技的不断发展，计算机视觉领域也取得了长足的进步。本文将介绍计算机视觉领域的十大算法，包括它们的基本原理、应用场景和优缺点。这些算法在图像处理、目标检测、人脸识别等领域有着广泛的应

发表于 02-19 13:26 •1241次阅读

工业视觉与计算机视觉的区别

工业视觉主要解决以往需要人眼进行的工件的定位、测量、检测等重复性劳动；计算机视觉的主要任务是赋予智能机器人视觉，利用测距、物体标定与识别等功能实现

发表于 01-16 10:06 •593次阅读

搜索历史

计算机视觉的实现基本过程

评论

计算机视觉有哪些优缺点

计算机视觉技术的AI算法模型

机器视觉和计算机视觉有什么区别

计算机视觉的五大技术

计算机视觉的工作原理和应用

计算机视觉与人工智能的关系是什么

计算机视觉与智能感知是干嘛的

计算机视觉和机器视觉区别在哪

计算机视觉和图像处理的区别和联系

计算机视觉属于人工智能吗

深度学习在计算机视觉领域的应用

机器视觉与计算机视觉的区别

计算机视觉的主要研究方向

计算机视觉的十大算法

工业视觉与计算机视觉的区别