图像处理基本算法-立体视觉

立体视觉是计算机视觉领域的一个重要课题，它的目的在于重构场景的三维几何信息。立体视觉的研究具有重要的应用价值，其应用包括移动机器人的自主导航系统，航空及遥感测量，工业自动化系统等。

1. 引言
立体视觉是计算机视觉领域的一个重要课题，它的目的在于重构场景的三维几何信息。立体视觉的研究具有重要的应用价值，其应用包括移动机器人的自主导航系统，航空及遥感测量，工业自动化系统等。

一般而言，立体视觉的研究有如下三类方法:
(1) 直接利用测距器（如激光测距仪）获得程距（range data）信息，建立三维描述的方法;
(2) 仅利用一幅图象所提供的信息推断三维形状的方法;
(3) 利用不同视点上的，也许是不同时间拍摄的，两幅或更多幅图象提供的信息重构三维结构的方法。

第一类方法，也就是程距法 (range data method)，根据已知的深度图，用数值逼近的方法重建表面信息，根据模型建立场景中的物体描述，实现图象理解功能。这是一种主动方式的立体视觉方法，其深度图是由测距器(range finders)获得的，如结构光(structured light)、激光测距器(laser range finders) 等其他主动传感技术 (ac tive sensing techniques)。这类方法适用于严格控制下的环境(tightly controlled domains)，如工业自动化的应用方面。

第二类方法，依据光学成象的透视原理及统计假设，根据场景中灰度变化导出物体轮廓及表面，由影到形(shape from shading)，从而推断场景中的物体。线条图的理解就是这样的一个典型问题，曾经引起了普遍的重视而成为计算机视觉研究领域的一个焦点，由此产生了各种各样的线条标注法。这种方法的结果是定性的，不能确定位置等定量信息，该方法由于受到单一图象所能提供信息的局限性，存在难以克服的困难。

第三类方法，利用多幅图象来恢复三维信息的方法，它是被动方式的。根据图象获取方式的区别又可以划分成普通立体视觉和通常所称的光流(optical flow)两大类。普通立体视觉研究的是由两摄像机同时拍摄下的两幅图象，而光流法中研究的是单个摄像机沿任一轨道运动时顺序拍下的两幅或更多幅图象。前者可以看作后者的一个特例，它们具有相同的几何构形，研究方法具有共同点。双目立体视觉是它的一个特例。

立体视觉的研究由如下几部分组成:
(1) 图象获取 (image acquisition),
用作立体视觉研究的图象的获取方法是多种多样的，在时间、视点、方向上有很大的变动范围，直接受所应用领域的影响。立体视觉的研究主要集中在三个应用领域中，即自动测绘中的航空图片的解释，自主车的导引及避障，人类立体视觉的功能模拟。不同的应用领域涉及不同类的景物，就场景特征的区别来分，可以划分成两大类，一类是含有文明特征(cultural features)的景物，如建筑、道路等; 另一类是含有自然特征的景物和表面(natural objects and surfaces)，如山、水、平原及树木等。不同类的景物的图象处理方法大不相同，各有其特殊性。
总之，与图象获取相关的主要因素可归纳如下:
(a) 场景领域 (scene domain)，
(b) 计时 (timing)，
(c) 时间（照明和阴影）(time of day (lighting and presence ofshadows))，
(d) 成像形态（包括特殊的遮盖）(photometry (including special coverage)),
(e) 分辨率 (resolution),
(f) 视野 (field of view),
(g) 摄像机的相对位置 (relative camera positioning).

场景的复杂程度受如下因素的影响:
(a) 遮掩 (occlusion),
(b) 人工物体（直的边界,平的表面) (man-made objects (straight edge, flat surfaces)),
(c) 均匀的纹理区域 (smoothly textured areas),
(d) 含有重复结构的区域 (areas containing repetitive structure)。

(2) 摄像机模型 (camera modeling),
摄像机模型就是对立体摄像机组的重要的几何与物理特征的表示形式，它作为一个计算模型，根据对应点的视差信息，用于计算对应点所代表的空间点的位置。摄像机模型除了提供图象上对应点空间与实际场景空间之间的映射关系外，还可以用于约束寻找对应点时的搜索空间，从而降低匹配算法的复杂性，减小误匹配率。

(3) 特征抽取 (feature acquisition),
几乎是同一灰度的没有特征的区域是难以找到可靠匹配的，因而，绝大部分计算机视觉中的工作都包括某种形式的特征抽取过程，而且特征抽取的具体形式与匹配策略紧密相关。在立体视觉的研究中，特征抽取过程就是提取匹配基元的过程。

(4) 图象匹配 (image matching),
图象匹配是立体视觉系统的核心，是建立图象间的对应从而计算视差的过程，是极为重要的。

(5) 深度计算 (distance(depth) determination),
立体视觉的关键在于图象匹配，一旦精确的对应点建立起来，距离的计算相对而言只是一个简单的三角计算而已。然而，深度计算过程也遇到了显著的困难，尤其是当对应点具有某种程度的非精确性或不可靠性时。粗略地说，距离计算的误差与匹配的偏差成正比，而与摄像机组的基线长成反比。加大基线长可以减少误差，但是这又增大了视差范围和待匹配特征间的差别，从而使匹配问题复杂化了。为了解决这一问题出现了各种匹配策略，如由粗到精策略，松驰法等。

在很多情况下，匹配精度通常是一个象素。但是，实际上区域相关法和特征匹配法都可以获得更好的精度。区域相关法要达到半个象素的精度需要对相关面进行内插。尽管有些特征抽取方法可以得到比一个象素精度更好的特征，但这直接依赖于所使用的算子类型，不存在普遍可用的方法。

另一种提高精度的方法是采用一个象素精度的算法，但是利用多幅图象的匹配，通过多组匹配的统计平均结果获得较高精度的估计。每组匹配结果对于最后深度估计的贡献可以根据该匹配结果的可靠性或精度加权处理。

总之，提高深度计算精度的途径有三条，各自涉及了一些附加的计算量:
(a) 半象素精度估计 (sub pixel estimation),
(b) 加长基线长 (increased stereo baseline),
(c) 几幅图的统计平均 (statistical averaging over several views)。
(6) 内插 (interpolation).

在立体视觉的应用领域中，一般都需要一个稠密的深度图。基于特征匹配的算法得到的仅是一个稀疏而且分布并不均匀的深度图。在这种意义下，基于区域相关匹配的算法更适合于获得稠密的深度图，但是该方法在那些几乎没有信息（灰度均匀）的区域上的匹配往往不可靠。因此，两类方法都离不开某种意义的内插过程。最为直接的将稀疏深度图内插成稠密的深度图的方法是将稀疏深度图看作为连续深度图的一个采样，用一般的内插方法（如样条逼近）来近似该连续深度图。当稀疏深度图足以反映深度的重要变化时，该方法可能是合适的。如起伏地貌的航空立体照片的处理中用这种方式的内插也许是比较合适的。但是这种方法在许多应用领域中，尤其是在有遮掩边界的图象的领域中，就不适用了。

Grimson 指出可匹配特征的遗漏程度反映了待内插表面变化程度的相应限度，在这种基础上，他提出了一个内插过程[2]。换一角度来看，根据单幅图象的“由影到形”的技术，用已经匹配上的特征来建立轮廓条件和光滑的交接表面可以确保内插的有效性。这些方法结合起来，可以使内插过程达到合乎要求的目标。内插的另一种途径是在已有的几何模型与稀疏深度图之间建立映射关系，这是模型匹配过程。一般而言，要进行模型匹配，预先应将稀疏深度图进行聚类，形成若干子集，各自相应于一种特殊结构。然后找每一类的最佳对应模型，该模型为这种特殊结构(物体)提供参数和内插函数。如 Gennery用这种方法来发现立体对图片中的椭园结构，Moravec 用于为自主车探测地面。

2. 双目立体视觉(Binocular Stereo Vision)

2.1 双目立体视觉模型
双目立体视觉理论建立在对人类视觉系统研究的基础上，通过双目立体图象的处理，获取场景的三维信息，其结果表现为深度图，再经过进一步处理就可得到三维空间中的景物，实现二维图象到三维空间的重构。Marr-Poggio-Grimson [1] 最早提出并实现了一种基于人类视觉系统的计算视觉模型及算法。双目立体视觉系统中，获取深度信息的方法比其它方式（如由影到形方法）较为直接，它是被动方式的，因而较主动方式（如程距法）适用面宽，这是它的突出特点。

双目立体视觉系统中，深度信息的获得是分如下两步进行的:
(1) 在双目立体图象间建立点点对应,
(2) 根据对应点的视差计算出深度。

第一部分，也就是对应点问题，是双目立体视觉的关键; 第二部分是摄像机模型问题。双目立体视觉模型中，双摄像机彼此参数一致，光轴平行且垂直于基线，构成一共极性 (epipolar) 结构，这样做是为了缩小对应的搜索空间，只有水平方向的视差，简化了对应过程，如下图所示。

如上图所示，设空间一点P(X,Y,Z)在两个平行放置的完全相同的摄象机中像点分别是(x1,y1).(x2,y2),则在知道基线长B和焦距f的情况下，可以计算出深度

这是双目立体视觉的基本原理，即根据视差来恢复立体信息。

2.2 匹配基元
匹配基元是指匹配算法的最小匹配对象，它是由特征抽取算法产生的。在建立立体视觉系统时，必须根据环境的特点和应用的领域选择适当的匹配基元。匹配基元可以是：
(1) 过零点 (zero-crossings),
(2) 边界与线片段 (edge and line fragments),
(3) 线性特征 (linear features),
(4) 边缘轮廓 (object boundaries),
(5) 兴趣算子抽取的特征点（如角点等）

基元作为匹配算法处理的基本单位，是局部特征，应包含以下一些信息:
(1) 维量（点、线、边界等） (dimensionality),
(2) 尺度（空间频度，长短、大小、方向等）(size (spatial frequency)),
(3) 亮度（对比度） (contrast),
(4) 语义量 (semantic content),
(5) 稠密度 (density of occurrence),
(6) 简单可量度的分布特征 (easily measurable attributes),
(7) 唯一性／突出性 (uniqueness/distinguishability)

2.3 匹配算法
匹配算法就是在两幅图象的匹配基元之间建立对应关系的过程，它是双目立体视觉系统的关键。实际上，任何计算机视觉系统中都包含一个作为其核心的匹配算法，因而对于匹配算法的研究是极为重要的。

为了比较全面地考察匹配算法，这里不妨将双目立体视觉的匹配算法扩展到更一般的情况来分析：假设给定两幅同一环境的图象，这两幅图象可能由于摄取的时间、方位或方式的不同而有差别，如双目立体视觉系统所摄取的两幅图象、地图与遥感或航测图象等，如何找到彼此对应的部分? 对于这个问题，一般有两种考虑途径:
(1) 灰度分布的相关性，
(2) 特征分布的相似性。

因而就有两类算法:
(1) 基于灰度的算法 (intensity based)，
(2) 基于特征的算法 (feature based)。

如果按照控制策略分，有如下几种:
(1) 粗到精多层次结构 (coarse-to-fine,hierarchical),
(2) 引入约束条件的松驰法 (constraints, relaxation),
(3) 多级表示的决策结构 (multilevel representation)。

2.3.1 基于灰度的匹配算法
基于灰度的算法是指图象处理中所称的区域相关方法 (area-correlation technique)，它是解决对应问题的一个最直观最简单的方法。在一幅图象中以一点为中心选定一区域（窗口），在另一幅图象中寻找与该区域相关系数最大的区域，把该找到的区域的中心认为是原来那区域中心的对应点。这里所说的图象包括经过某种特殊处理如Gauss滤波后的图象。

这种算法计算量大，但可以得到整幅图象的视差图。该算法对噪音很敏感，考虑到计算量，窗口不宜开得过大，因而可能匹配的选择较大，误对应可能性大，不适于灰度分布均匀的图象，较适于灰度分布很复杂的图象，如自然景物等。采用该方法的关键在于排除或减轻噪音的影响。通常采用多层次相关对应及多幅图象的统计平均处理方式来实现。如 D. B. Gennery [2]采用九幅图象多级处理方式来实现对应求解。

2.3.2 基于特征的匹配算法
鉴于灰度区域相关方法的局限性，现在大部分研究集中在这方面。在许多环境（如有线条轮廓特征可寻的人工环境 (man-made structured world)）中，图象的特征是很有规律地分布的，反映了场景的核心，数量少，处理方便。基于特征的匹配算法特别适用于特殊的比较简单的环境如室内环境，具有速度快、精度高的特点，但对于自然环境，由于缺少显著的主导特征，该方法也遇到了很大困难。

基于特征的双目立体视觉的对应算法，通过建立所选基元的对应关系，旨在获取一稀疏深度图，如果需要再经过内插等方法可以得到整幅深度图。这一类算法因各自采用的匹配基元不同而相异。概括而言，该类匹配算法都是建立在匹配基元之间的相似性度量基础上的。这种相似性度量被称为亲合性 (affinity)[2]，它是以匹配基元的各项参数信息为依据的局部特征相似程度的度量。这种度量方法与摄像机模型相结合，可以大大减小匹配时的搜索空间。

由于仅利用亲合性建立匹配是模糊的，可能匹配的空间仍旧很大（多对一的），因此有必要引入其它约束条件及控制策略来限制搜索空间，减小模糊程度。匹配算法中常引入的两种约束条件及控制策略是:
(1) 共极性 (epipolar) （双目立体视觉模型特点）,
(2) 连续性 (continuity),
(3) 分层次的匹配策略（即由粗到精策略）(hierarchical (e.g.,coarse-fine) matching strategy)。
这种引入约束的方法实际上是将有关环境模型的知识融于算法之中。

这种算法的具体实现，可以采用概率度量、松驰法迭代或者聚类等模式识别算法来实现。作为最后结果的1-1 对应，可以利用启发式搜索方法从已经大大减小了的搜索空间中获得。这部分可望能利用现代 AI 研究的许多手段如专家系统等研究方法，作为承上启下，建立更高层次描述的先导。

可以从以下几个角度来比较各种匹配算法，
(1) 精度 (accuracy),
(2) 可靠性（排除总体分类误差的程度）(reliability)，
(3) 通用性（适于不同场景的能力）(available of performance models),
(4) 预见性 (predictability),
(5) 复杂性（设备及计算量的代价）(complexity (cost implementation, computational requirements))。

立体视觉的匹配算法有:
(1) Marr-Poggio-Grimson算法，以过零点为基元，采用由粗到精的控制策略，用精度较低层次的匹配来限定精度较高层次匹配的搜索空间，最后利用连续性约束通过迭代方式实现匹配过程。处理对象是自然景物的双目立体图象。

(2) R. Nevatia-G.Medioni算法，以线片段 (segments) 为基元，以最小差别视差 (minimum differential disparity) 为基准，建立匹配过程。该基准实际上是连续性约束的一种表现形式，在对应线片段各自邻域内存在的对应线片段的视差与其视差相近。处理对象是人工环境的双目立体图象。

(3) R. Y. Wong算法，旨在建立两类图象的对应关系，如航空照片、遥感图象与灰度图象之间的对应关系。以边界特征(edge feature)为依据采用顺序的 (sequential)、多层次结构 (hierarchical structure)的搜索策略实现匹配过程。

(4) K. Price-R. Reddy算法，依据场景的线条特征模型，将自顶向下（人工智能）(top-down (artificial intelligence))与自底向上（模式识别）(bottom-up (pattern recognition)) 两种控制策略有效地结合起来，采用广义的相关方法进行匹配，旨在建立形态差别较大的两幅图象（一幅是参照图或参考模型，另一幅是待对应的图象）的对应关系。如机场模型与机场的航空照片之间的对应关系。

(5) C. S. Clark-A. L. Luck-C. A. McNary算法，抽取线条轮廓特征建立模型，在模型间建立对应。适于存在较大差别的图象的匹配。

(6) K. E. Price算法，用于在图象间建立区域对应。该算法利用区域间的相互关系，以松驰法为基本思想实现了多层次表示结构下的匹配过程。突出特点是匹配算法考虑了图象本身区域间的相互关系（如包含、子部分等）的匹配，具有类似于某种语义网络式的启发性。

(7) R. Horaud-T. Skorads算法，以线条特征为匹配基元，每个线条特征不仅含有其本身的端点坐标及方向矢量信息，而且含有它同那些与其相邻的线条特征之间存在的相对位置及结构关系的信息。这些特征将每幅图象表示成为一个关系图，根据该关系图对于每个线条特征确定它在另一幅图象中的可能对应集合，以每组对应为一结点构造对应图，依据关系图的相容性通过利益函数（benefit function）确定最佳对应。它处理的对象是室内环境的双目立体图象。

(8) W. Hoff-N. Ahuja算法，以过零点为最小特征，将特征匹配、轮廓检测以及表面内插这三个过程结合在一起，采用基于多层表示的由粗到精的控制策略，根据对于表面的光滑性约束重构三维表面。这是一种与传统方法大不相同的算法，适合于有纹理特征的环境如工作台上的物品，不适合于稀疏特征环境如室内环境。另外 S. I. Olsen提出的算法与此相似，它将表面的重构过程（reconstruction process）结合在对应匹配过程中，基于多重属性用松弛法进行匹配，逐步提高重构的视差表面与实际的视差数据的一致性。

2.4 双目立体视觉系统
双目立体视觉经过几十年的研究已经取得了显著了成果，出现了各种专门的硬件设计和视频速率（实时）的立体视觉系统，在理论和技术方面都比较成熟了。但是，从普遍的意义来讲，由于很难彻底地解决对应点问题，具体的立体视觉系统一般都是有针对性的、不是普遍适用的，还无法与人类的双目视觉系统相媲美。

下图是SRI的集成在电路板上的双目立体视觉系统。CMU设计了Stereo Machine, 可以实时地获取深度信息。

立体摄象机校准 Stereo Camera Calibration
三维视觉
Milan Sonka, 3D Vision
集成在电路板上的立体摄象机对SRI Stereo Engine, Stereo head onboard
立体几何模型 SRI Stereo Geometry
双目立体视觉Introduction to Stereo Imaging -- Theory

3. 结构光方法(Structured Light)

将平面光束照射在物体上可以形成光带，光带的偏转数据反映了物体表面的三维形状信息，用这种方法可以精确地获取物体的三维信息。借助于一组平行的平面光，或将物体置于专门的旋转工作台上通过一束平面光，都可以利用偏转数据直接地计算出深度信息，称这种方法为结构光方法。结构光方法适合于限制条件下，局部范围内需要精确测量的情况，用于不规则表面的三维建模。

结构光方法在工业上有重要的应用，例如从传送带上检测工件，工件的逆工程（Reverse engineering）；在图形建模方面也有重要的应用，如人体建模，包括头部等躯体模型，雕塑造型的数字化。实际上它是三维扫描仪的基本原理。

如下图所示的装置，就是结构光方法的典型事例。

详细可见：Our Active Stereo Vision System

4. 激光雷达与程距数据(Range Data)处理

激光雷达（Laser range finder）与结构光方法不同，它直接利用激光光速扫描物体，通过测量光束从发出到反射回来的时间差来计算深度信息。它提供的数据是深度图，称为程距数据（Range data）。激光雷达可以用于比较大范围的测量，如移动机器人可以用激光雷达信息来建立环境内模型，以实现自主导航、躲避障碍等功能。

程距数据实际上就是深度图象，结构光方法和激光雷达得到的数据最后都是深度信息。程距数据处理主要是表面拟合，恢复物体的表面结构。

5. 视觉临场感系统

临场感（Telepresence）技术是新一代遥操作（Teleoperation）系统的重要组成部分。顾名思义，它的目的就是使人从远地遥控操作时具有在现场处实地操作式的身临其境的感觉。在理想情况下，这些感觉应该包括人的各种感官所能感受到的感觉，如视觉、听觉、触觉、味觉、体位觉、力感等。

临场感系统因其面对的任务不同，所需的现场信息有所区别，其中，视觉通常是最重要的信息之一，其次才是听觉、触觉等。目前，临场感技术主要涉及视觉和听觉。

临场感遥操作系统的主要优点是：将人与机器人有机地结合起来，能够恰到好处地发挥出各自的特长。机器代替人去危险或人不可能到达的区域去工作，而人的判断能力和决策水平又明显地提高了系统的整体智能水平。

如下图所示，室外车辆上的立体摄象机将视频信号传回基地端，操作员通过立体眼睛观察环行屏幕，仿佛他亲自在车上一样能够具有身临其境的感觉。

（参见：艾海舟、张朋飞、何克忠、江潍、张军宇，室外移动机器人的视觉临场感系统，机器人，22（1）：28-32，2000。）

有关立体视觉的前沿工作请参见微软研究院张正友博士的网页，他是这方面的著名学者：~zhang/

参考文献
1.马松德、张正友，计算机视觉计算理论与算法基础，科学出版社，1998。
2.艾海舟,关于双目立体视觉的研究,硕士论文,121页,1988.4.
3.艾海舟, 关于移动机器人自主式系统的研究, 博士论文, 153页, 1991.3.

最近一直学习立体视觉，写了很多的代码，但是还没整理具体的算法。使用左右两张图片，计算深度图

阅读全文

12 3 4 5 下一页全文

本文导航

第 1 页：图像处理基本算法-立体视觉
第 2 页：左图如下：
第 3 页：//DP5

图像处理(55011) 图像处理(55011)
算法(90083) 算法(90083)

机器视觉之图像增强和图像处理

对原始获取图像进行一系列的运算处理，称为图像处理。图像处理是机器视觉技术的方法基础，包括图像增强、边缘提取、图像分割、形态学处理、图像投影、配准定位和图像特征提取等方法。

2023-10-23 10:43:08

机器视觉：图像处理技术、图像增强技术

2023-10-20 10:17:34

LiDAR和立体视觉摄像头如何处理低光

的距离传感解决方案，尽管性能存在显着差异，特别是在恶劣的天气和道路条件下。 Nodar是AV先进立体视觉技术的提供商，最近进行了一系列面对面的性能测试，以比较 LiDAR 和立体视觉摄像头如何处理低光，黑暗和恶劣天气条件，以及检测道路上的

2023-10-13 15:33:25

关于双目立体视觉的三大基本算法及发展现状

双目立体视觉一直是机器视觉研究领域的发展热点和难点，“热”是因为双目立体视觉有着及其广阔的应用前景，且随着光学、计算机科学等学科的不断发展

2023-08-25 17:28:33

895

双目立体视觉是什么？单目视觉与双目立体视觉的区别？

双目更多的是基于物理测量，而单目视觉则是基于逻辑推理，通过大量的数据训练，先识别出目标，再根据目标的大小和高度估算距离。因此，单目视觉的漏检率高于双目立体视觉，因为客观上存在corner case。

2023-08-17 09:40:06

499

双目立体视觉原理 HALCON的双目视觉系统研究

、图像预处理和特征提取、立体匹配以及三维重建。为解决智能移动机器人、工业装配机器人、家用机器人、公共服务机器人的视觉问题，双目立体视觉技术的进一步研究可对多目视觉具有重要的启发。　　本文对双目立体视觉测深

2023-07-19 14:18:24

双目立体视觉理论及应用

采用立体视觉，不需要红外传感器、声波定位仪、激光雷达等测距传感器，可大大降低了技术解决方案的成本。

2023-07-19 12:41:18

189

如何通过立体视觉构建小巧轻便的深度感知系统

在本文中，我们首先介绍了立体视觉系统的主要部分，并提供了有关使用硬件组成和开源软件制作定制立体相机的说明。由于此设置专注于嵌入式系统，因此它将实时计算任何场景的深度图，而无需电脑主机。

2023-07-13 16:49:17

204

双目立体视觉三大算法原理及其代码实现

双目立体视觉中常用的基于区域的局部匹配准则主要有图像序列中对应像素差的绝对值之和SAD（sum of absolute differences）、对应像素差的平方之和SSD（sum of squared differences）及半全局匹配算法SGM（semi—global matching）。

2023-07-01 09:34:02

655

图像处理与机器视觉

很强的针对性。因此，图像增强算法的应用也是有针对性的，并不存在一种通用的、适应各种应用场合的增强算法。于是，为了使各种不同特定目的的图像质量得到改善，产生了多种图像增强算法。这些算法根据处理空间的不同分为

2023-06-20 15:41:44

边缘AI套件上的立体视觉深度感知

电子发烧友网站提供《边缘AI套件上的立体视觉深度感知.zip》资料免费下载

2023-06-12 14:36:40

中科慧眼基于AI平台的全新立体视觉方案实现产品化落地

基于立体视觉感知技术，中科慧眼路面预瞄系统与主动、半主动悬架系统结合而实现车体在垂直方向上的自适应控制，不仅可进一步保持并提升减震效果，显著提高车辆智能驾驶平顺性与通过性，实现优越的驾乘体验；

2023-04-23 10:09:23

436

基于双目立体视觉的测距原理、工作流程及优点分析

简单来说，基于双目立体视觉的测距类似人类的双眼，和基于TOF、结构光原理的测距不同，它不对外主动投射光源，完全依靠拍摄的两张图片（ RGB 或者灰度图）来计算距离。

2022-11-18 14:21:28

2555

Netduino上的立体视觉

电子发烧友网站提供《Netduino上的立体视觉.zip》资料免费下载

2022-11-08 11:57:32

双目立体视觉的定义与理解

总结一下，我们现在认识了三种制造立体视觉的方法，分别是视觉陷阱、全息投影和产生视差。双目立体视觉这一有着广阔应用前景的学科，随着光学，电子学以及计算机技术的发展，将不断进步，逐渐实用化，不仅将成

2022-10-31 15:20:41

1443

3D图像处理常使用的技术

立体视觉的工作原理依照人类的一双眼睛。使用两个相机记录一个对象的两个2D图像。并且，从两个不同的位置记录同样的场景，借助三角测量原理，使用深度信息合成一幅三维图像。

2022-10-25 09:56:46

535

如何通过立体视觉构建小巧轻便的深度感知系统

有多种 3D 传感器方案来实现深度感知系统，包括立体视觉相机、激光雷达和TOF(飞行时间)相机。每个选择都有其优缺点，其中，嵌入式深度感知立体系统成本低，坚固耐用，适合户外使用，并且能够提供高分辨率的彩色点云。

2022-08-23 16:45:15

902

华为nova10 Pro拥有全新双目立体视觉影像系统业界首发前置人像特写镜头

华为nova10 Pro拥有全新双目立体视觉影像系统业界首发前置人像特写镜头审核编辑：彭静

2022-07-05 14:57:29

855

双目立体视觉深度测量步骤介绍

深度信息恢复是计算机视觉领域的一个重要研究内容。使用传统的光学成像系统对不同距离的物体成像时，需要机械移动会造成图像放大率变化，导致深度测量产生误差。近年来，电控调焦的液晶透镜光学成像系统已实现对焦、变焦、深度测量等功能，利用液晶透镜光学成像系统进行双目立体视觉深度测量可以扩张双目深度测量范围。

2022-06-14 13:43:18

1879

基于Xilinx KV26的立体视觉匹配方案

深度估算是自动驾驶领域的一项关键技术。作为自动驾驶中最常用的传感器，摄像头能够获取全面、丰富又密集的信息。基于立体视觉的深度估算技术可以准确识别和定位运动与静止目标以及路面对象。

2022-06-10 10:37:42

4622

基于Xilinx KV26的立体视觉匹配方案

2022-06-01 09:36:13

1959

[原创]“立体视”与新概念3D电视机制造（摘要）

   “立体视”是本文用以描述人类某种视觉能力的代名词。是本人对人类视觉能力的一个最新的重要发现。研究表明，“立体视”是人类视觉系统中天赋的一种能力，广泛存在于

2010-01-27 16:24:43

如何利用立体视觉实现距离估计？

/ 导读 / 双目立体视觉（Binocular Stereo Vision）是机器视觉的一种重要形式，它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像，通过计算图像对应点间的位置偏差

2021-07-01 09:15:22

2179

面向双目立体视觉的迭代式局部颜色校正方法

面向双目立体视觉的迭代式局部颜色校正方法

2021-06-21 14:42:04

机器视觉工业缺陷检测常用的图像处理算法

常用的图像处理算法： 1、图像变换：（空域与频域、几何变换、色度变换、尺度变换）几何变换：图像平移、旋转、镜像、转置；尺度变换：图像缩放、插值算法（最近邻插值、线性插值、双三次插值）；空域

2021-06-15 17:59:02

6597

视觉方案有那么多种知道我为何更看好双目视觉吗

双目视觉技术的原理、结构、特点、发展现状和发展方向分析双目立体视觉是机器视觉的一种重要形式，它是基于视差原理并由多幅图像获取物体三维几何信息的方法。双目立体视觉系统一般由双摄像机从不同角度同时

2021-06-01 16:36:56

2016

大联大世平集团推出基于NXP S32V234的双目立体视觉解决方案

由大联大世平推出的基于NXP S32V234双目立体视觉解决方案，可显著提高物体识别率以及识别种类，从而进一步完善ADAS领域的相关应用。

2021-05-18 14:13:29

970

一篇文章带你认识《双目立体视觉》

前言双目立体视觉，由两个摄像头组成，像人的眼睛能看到三维的物体，获取物体长度、宽度信息，和深度的信息；单目视觉获取二维的物体信息，即长度、宽度。 1）双目摄像头常见的双目摄像头有以下几款：能看

2021-04-26 14:19:43

8487

双目立体计算机视觉的立体匹配研究综述

双目立体视觉技术具有成本低、适用性广的优点，在物体识别、目标检测等方面应用广泛，成为计算机视觉领域的研究热点。立体匹配是双目立体视觉技术中的核心算法，对实现物体三维重建具有重要作用。在分析局部、全局

2021-04-12 09:47:54

如何使用FPGA实现微型实时多目立体视觉机的设计

并行处理能力和各算法间的多级流水线关系，在一片FPGA芯片上实现了立体视觉信息的实时处理。设计的立体视觉机体积小，运行速度快。当图像分辨率为320×240像素，深度搜索范围为64级，深度图精度为8位，时钟频率为60MHz时，恢复稠密深度图

2021-04-02 09:33:00

如何使用FPGA实现三目立体视觉外极线校正的方法

提出一种三目立体视觉外极线校正的快速算法.3个摄像机呈直角三角形配置，且已知摄像机透视投影矩阵。根据校正基本约束确定校正后的图像平面，利用图像不变形约束计算校正所需的三阶矩阵，用于在平面仿射坐标系下

2021-04-01 10:27:29

Ambarella为自动驾驶汽车赋予了立体视觉

Ambarella日前推出了一款名为CV2的新型相机SoC，专用于提供深度神经网络（DNN）和立体视觉处理，瞄准ADAS和自动驾驶汽车市场。

2020-12-26 01:16:14

271

机器视觉在工业市场的应用基于机器视觉的双目图像采集处理实例

什么是机器视觉机器视觉是一项综合技术，包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术(图像增强和分析算法、图像卡、I/O卡等)。一个典型的机器

2020-10-09 16:01:01

3016

如何使用DSP实现机器视觉的道路图像采集和处理系统的设计

当前机器视觉在各种导航系统中的应用日渐成熟，这种技术正是建立在数字信号和图像处理成熟理论和算法基础之上，本系统借鉴机器视觉导航技术主要为智能型道路划线车提供精确的定位，以使划线车能够准确的获知在道路

2020-08-18 17:20:00

CCD双目立体视觉测量系统的理论研究详细说明

利用几何成像原理建立起CCD双目立体视觉测量系统的数学模型，从提高系统测量精度出发，在理论上重点对系统结构参数、图像识别误差与系统测量精度的关系进行了深入的分析和探讨，并通过实验对结论进行了验证。研究内容对实际建立该测量系统具有很强的指导作用。

2020-03-30 13:52:06

使用双目立体视觉实现CCD测距系统设计的资料说明

的CCD测距技术。双目立体视觉的基本原理是模仿人眼与人类视觉的立体感知过程，从两个视点观察同一景物，以获取不同视角下的感知图像，通过三角测量原理计算图像像素间的位置偏差，以获取景物的三维信息。一个完整的CCD测距系统通

2019-11-26 12:05:39

双相机立体视觉和结构光立体视觉原理及优势对比

目前的深度相机根据其工作原理可以分为三种：TOF相机、双相机立体视觉、结构光投射立体视觉。

2019-05-14 09:04:58

7350

双目立体视觉在动车车身关键尺寸检测中的应用

针对动车（ CRH）车身尺寸范围大、检测项目复杂、车型变化多，不容易实现在线测量的难题，首先提出了大型动车车身关键尺寸的测量方案，利用双目电荷耦合装置（ CCD）立体视觉建立各个关键尺寸的视觉测量

2019-01-03 11:10:06

双目主动立体视觉监测平台靶标编码标志点的设计与识别分析

双目立体视觉测量是基于视差原理，由多幅图像获取物体三维几何信息的方法。在计算机视觉系统中，双目立体视觉测量一般由双摄像机从不同的角度同时获取周围景物的两幅图像，或有单摄像机在不同时刻从不同角度获取周围景物的两幅数字图像，并基于视差原理即可恢复出物体的三维几何模型，重建周围景物的三维形状与位置。

2018-12-29 08:50:00

3697

15个使用FPGA进行图像处理的相关论文资料免费下载

本文档的主要内容详细介绍的是15个使用FPGA进行图像处理的相关论文资料免费下载主要内容包括了：图像调焦算法研究及FPGA实现，微型实时多目立体视觉机设计与实现，无线激光图像传输收发电路的设计与实现

2018-12-25 08:00:00

如何使用FPGA实现一种图像预处理结构及典型算法

图像滤波和边缘检测等预处理算法是视觉导航系统中道路检测和车辆检测等复杂视觉处理的前提，其性能和处理时间直接影响了后续图像处理的性能及视觉系统的整体响应时间。本文给出了一种基于FPGA的流水线图像

2018-12-13 17:56:52

使用CNN，密集光流和立体视觉的自主感知演示

这种自动驾驶演示运行了当今自动系统中常用的三种主要复杂算法，即卷积神经网络（CNN），密集光流和立体视觉，所有这些都在一个Zynq Ultrascale + MPSoC器件中。

2018-11-28 07:00:00

1835

重庆钜芯视觉科技发布国内首款智能双目立体视觉芯片

智能双目立体视觉芯片模拟人的“双眼”，给车辆加上一双“眼睛”，将二维成像变为三维成像。

2018-10-08 15:31:12

6819

什么是“Blockdrop”？立体视觉应用的神经形态技术

在硬件方面，IBM Research瞄准了一种利用棘波神经网络的立体视觉系统；该公司表示，目前产业界是使用两个传统(讯框)摄影机来产生立体视觉，但从未有人尝试过神经形态技术。虽然以传统摄影机提供立体

2018-06-26 09:51:54

4467

Humanplus人加为各类机器人提供立体视觉感知解决方案

依托自主研发的嵌入式主动/被动双目立体视觉技术，人加已经推出双目AI摄像头产品——“司眸”系列，可以为各类机器人提供立体视觉感知解决方案，让机器人拥有人体感知、自主避障等视觉智能，为下游客户提供成熟、可量产的解决方案。

2018-06-07 14:44:08

5358

双目立体视觉摄像头模块开发设计

本作品为基于ATLYS FPGA开发平台、VmodCAM双目摄像头模块开发设计的双目立体视觉系统。VmodCAM用于采集双路的视觉信息，FPGA开发平台负责完成视觉信息的处理及图像的高速分析。采集

2018-05-28 09:51:00

2733

双目立体视觉三维测量原理

双目立体视觉是基于视差，由三角法原理进行三维信息的获取，即由两个摄像机的图像平面和北侧物体之间构成一个三角形。一直两个摄像机之间的位置关系，便可以获得两摄像机公共视场内物体的三维尺寸及空间物体特征点的三维坐标。所以，双目视觉系统一般由两个摄像机构成。

2018-04-11 14:32:55

22551

仿生双眼的立体视控制系统

仿生眼平台以及前人对人眼观看立体世界双眼工作机理的研究成果，提出了一种基于视觉反馈的仿生双眼的立体视控制方法。对左右眼摄像机采集的同步图像进行特征点提取、匹配以及一系列过滤筛选得到准确的特征点对，利用这些特

2018-04-09 11:48:13

双目视觉技术的原理、结构、特点、发展现状和发展方向分析

双目立体视觉是机器视觉的一种重要形式，它是基于视差原理并由多幅图像获取物体三维几何信息的方法。双目立体视觉系统一般由双摄像机从不同角度同时获得被测物的两幅数字图像，或由单摄像机在不同时刻从不同角度

2018-02-08 14:46:24

47798

3D双目立体视觉在机器人视觉的应用

随着自动化程度越来越高，机器视觉扮演着越来越重要的角色，传统的2D定位无法解决产品的空间坐标信息，而3D双目立体视觉可提供较高精度的定位。

2018-02-02 10:54:49

15278

立体视频的传输失真估计

，采用递归算法准确地估计失真，并运用时域帧拷贝的错误隐藏方法降低解码端的复杂度。仿真结果表明，失真模型的平均预测误差能控制在6%以内，对于不同特性和分辨率的立体视频序列，在不同网络环境下传输失真估计均有一定

2018-01-23 17:19:29

基于双目立体视觉的桥梁裂缝测量

针对国内外桥梁裂缝测量效率低、成本高、精度低等现状，提出了一种基于双目立体视觉技术的桥梁裂缝测量系统。采用相机标定、图像匹配、三维坐标计算等双目立体视觉技术对桥梁裂缝的宽度和长度进行计算，实现了桥梁

2018-01-16 14:59:59

图像处理算法有哪些_图像处理十大经典算法

图像处理，是对图像进行分析、加工、和处理，使其满足视觉、心理以及其他要求的技术。目前大多数的图像是以数字形式存储，因而图像处理很多情况下指数字图像处理。本文接下来将简单粗略介绍下数字图像处理领域中的经典算法。

2018-01-12 16:17:20

82843

基于斜交视锥立体摄像机模型的虚拟现实立体视觉解决方案

针对虚拟现实领域现有的显示模块无法提供满足人眼视觉规律的立体视觉效果这一问题，提出一种基于斜交视锥体立体摄像机模型的虚拟现实（VR）立体视觉解决方案。首先，通过研究人眼视域模型和人眼双目提取深度信息

2018-01-03 16:03:44

视觉显著性的快速区域立体匹配算法

针对区域立体匹配算法对光照变化敏感，视差图存在目标和弱纹理区域的错配、边界不平滑等问题，提出一种利用视觉显著性特征改进的快速区域立体匹配算法。该算法先利用显著性检测定位图像主要目标区域；再结合索贝尔

2017-12-28 17:09:28

基于立体视觉的在线实时测量系统设计与实现

为了满足深空探测器实时测量天体表面形貌的需求，设计并实现了一套基于立体视觉的在线实时测量原型系统。该系统通过立体相机实时获取空间天体的立体影像，利用每次观测的一组立体影像来重建其局部表面形状；再

2017-12-19 16:25:11

双目立体视觉测距系统步骤改进优化

所谓的计算机视觉是指用各种成像系统代替视觉器官作为输入敏感手段，由计算机来代替大脑完成处理和解释。一台摄像机机在获取图像信息时会丢失掉图像的深度信息，凶此拍m的图像不会像人的双眼观察得有立体感。机器

2017-11-08 16:20:34

基于HALCON的双目是相机立体视觉系统标定

摄像机标定是机器视觉和摄像测量领域相对基础的工作，同时也是最复杂、困难的T作。摄像机标定的意义是得到立体空间中对象的几何信息，其中所使用的图像信息由双目摄像机所得。定后的双目摄像机得到的图像目标信息

2017-11-06 14:41:05

基于指导滤波立体匹配的视觉测距系统（SAD算法）

目前在机器人自主导航方面，立体视觉的应用前景广阔。，相比于造价昂贵的激光雷达，立体视觉的硬件成本仅为其五分之一左右; 而相比于超声波测距，立体视觉又有着较远的测距距离。得益于高精度的立体匹配算法

2017-10-30 17:04:44

三维立体视觉技术的应用及其三维恢复方法介绍

感知与建模、机器人导航、双目物体跟踪与检测以及图像分割等领域。三维立体视觉就是研究由2D图像恢复场景目标即3D信息的一门学科。目前用于三维恢复的方法主要有：结构光法、立体视觉法、光流法、亮度立体法、阴影法和纹

2017-10-20 11:51:30

基于双目视觉的立体匹配算法研究_罗大思

2017-03-04 18:03:51

三目立体视觉外极线校正及其FPGA实现方法

三目立体视觉外极线校正及其FPGA实现方法

2016-09-17 07:30:24

微型实时多目立体视觉机设计与实现

微型实时多目立体视觉机设计与实现，感兴趣的小伙伴们可以看一看。

2016-09-14 17:17:07

图像分割方法的研究现状与展望

立体视觉的应用越来越广泛，立体视觉需要用到图像分割方法，这个论文是有关图像分割的研究现状与展望

2016-05-20 16:50:06

一种基于图像处理的双目视觉校准方法

双目视觉是利用机器视觉进行障碍物检测的研究热点。针对双目视频不同步，导致立体匹配不精准的问题，提出了一种基于图像处理的双目校准算法。算法首先根据道路的先验特征模型，建立视觉校准的敏感区域，以减小

2015-12-18 16:26:57

立体视觉技术分析

本文将试着去阐述立体视觉技术。阅读完本文后你将对数据如何在系统中流动和其间所有可调整的参数有一个更深入的了解。这将使你可以量身定做自己的系统来完成特殊的任务。

2012-04-28 15:08:11

双目立体视觉在光电子器件自动对接系统中的应用

介绍了双目立体视觉在光电子器件自动对接系统中的应用。该系统以线性成像模型为基础建立了双目立体视觉系统的数学模型，介绍了视觉系统标定的实现，包括标定点提取、特征点定

2011-10-11 15:15:42

冗余离散小波变换立体视差估计及DSP实现

立体图像技术将是未来多媒体发展的重点方向，其中视差估计是立体图像处理的关键，针对目前视差估计方法的不足，提出了一种基于冗余离散小波变换的视差估计算法。首先对参考图

2011-09-30 15:06:08

双目立体视觉传感器精度分析与参数设计

根据双目立体视觉传感器三角立体视差模型，建立了结构参数误差的传递函数，分析了双目视觉传感器结构参数及其误差传递规律对传感器综合测量精度的影响，得出了结构参数的合理

2011-09-06 14:38:40

基于H.264的立体视频编码方法

H.264是一种高效的视频编码压缩标准，它集中了以往标准的优点。基于H.264的高效编码压缩技术，文章研究了块基立体视频编码方法，并对基于H.264, 和基于H.264的立体视频编码方案进行了

2011-06-10 16:34:09

AVS立体视频编码方法

提出一种基于AVS(audio video coding standard)的快速立体视频编码方法，对左路参考图像使用AVS编码器编码，对右路目标图像同时在时间域和空间域进行预测. 使用两级神经分类器来快速确定预

2011-05-14 10:54:55

基于HALCON的双目立体视觉系统实现

双目立体视觉的研究一直是机器视觉中的热点和难点。使用双目立体视觉系统可以确定任意物体的三维轮廓，并且可以得到轮廓上任意点的三维坐标。因此双目立体视觉系统可以应用在

2011-04-08 17:51:29

130

双目立体视觉中靶标的设计与识别

0 引言双目立体视觉测量是基于视差原理，由多幅图像获取物体三维几何信息的方法。在计算机视觉系统中，双目立体视觉测量一般由双摄像机从不

2010-09-26 17:07:03

955

已全部加载完成