0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

计算机视觉中的双目立体视觉和体积度量

新机器视觉 来源:AI公园 作者:Yauheni Marushko 2022-08-19 16:10 次阅读

导读

一个双目立体视觉的常用应用场景的介绍,很基础。

立体视觉

立体视觉意味着人工智能可以通过一对相机来感知图像的深度以及物体的距离。大多数三维相机模型都是基于立体视觉理论和技术的。两台摄像机之间设置一定的距离,这样它们就可以从不同的角度“看”物体。评估两个图像之间的对应关系,人工智能确定到目标的距离,分析,并建立目标的3D结构。

采用立体视觉,不需要红外传感器、声波定位仪、激光雷达等测距传感器,可大大降低了技术解决方案的成本。

271dd538-1f81-11ed-ba43-dac502259ad0.png

主要应用场景:

1、人体姿态和手势识别。

2、3D模型和3D场景的构建。

3、自动驾驶系统的障碍定位和检测

每个特定的场景都可以改动以解决特定的问题。因此,3D场景重建可以用来测量物体或产品的体积。

在实践中,立体视觉通过两台摄像机分四个阶段实现:

1、畸变校正 — 一种去除图像上透镜的径向和切向畸变的数学方法,以获得未失真的图像。

2、在校正过程中调整相机之间的角度和距离。结果是直线对齐和细化图像,即同一平面的两幅图像共面,其直线对齐方向相同,具有相同的y坐标。

272a7b8a-1f81-11ed-ba43-dac502259ad0.png

3、点匹配过程 — 搜索左、右摄像头点之间的对应关系。在那之后,你会得到有一个视差图 —— 其中的值对应于左右摄像机同一点的图像x坐标的差异。

4、因此,有了相机的几何排列,我们产生了视差图的三角度量。这是重投影阶段,形成深度图,也就是想要的3D场景。

对于前两个阶段,你必须首先计算这一对相机的配置参数。这可以通过各种二值化的标定板自动完成,比如ArUco或ChArUco。这些标定板的主要优点是,即使是单个标定板也能提供足够的一致性来获得相机的姿势。此外,内部的二进制编码使它们特别可靠,因为它可以进行错误检测和纠正。你也可以使用标定板来确定相机下区域的几何形状。

2750bd4a-1f81-11ed-ba43-dac502259ad0.png

体积度量

为了度量体积,你还需要进行下面的步骤:

1、对一组连续的帧进行累积,这将增加错误恢复的弹性,用于对3D场景进行平均或细化。

2、只在场景中选择产品定义的点。这是通过使用颜色分割、模板匹配或神经网络语义分割来实现的。最快的方法是颜色分割。该方法的缺点是将设置绑定到特定的产品上,如果背景颜色和对象不是很清楚,可能会产生不好的结果。如果GPU优化是可能的,那么使用U形卷积神经网络如U-net和高级U-net,或全卷积神经网络会有较高的性能和分割精度。

3、对一个由产品定义的3D点组成的场景进行聚类。每个簇是一个对象。

275f8b72-1f81-11ed-ba43-dac502259ad0.png

277aa70e-1f81-11ed-ba43-dac502259ad0.png

4、为每个簇形成一个凸多边形,消除3d场景对象的边缘缺陷

5、使用线性插值恢复缺失的3D点

6、通过基于场景的几何聚类区域积分来计算单个对象的体积。

279210ec-1f81-11ed-ba43-dac502259ad0.png

7、最后,计算所有物体的总体积。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 立体视觉
    +关注

    关注

    0

    文章

    36

    浏览量

    9767
  • 计算机视觉
    +关注

    关注

    8

    文章

    1694

    浏览量

    45894
  • 自动驾驶
    +关注

    关注

    782

    文章

    13616

    浏览量

    165899

原文标题:计算机视觉中的双目立体视觉和体积度量

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    计算机视觉有哪些优缺点

    计算机视觉作为人工智能领域的一个重要分支,旨在使计算机能够像人类一样理解和解释图像和视频的信息。这一技术的发展不仅推动了多个行业的变革,也带来了诸多优势,但同时也伴随着一些挑战和局限
    的头像 发表于 08-14 09:49 636次阅读

    机器视觉计算机视觉有什么区别

    机器视觉计算机视觉是两个密切相关但又有所区别的概念。 一、定义 机器视觉 机器视觉,又称为计算机
    的头像 发表于 07-16 10:23 433次阅读

    计算机视觉的工作原理和应用

    计算机视觉(Computer Vision,简称CV)是一门跨学科的研究领域,它利用计算机和数学算法来模拟人类视觉系统对图像和视频进行识别、理解、分析和处理。其核心目标在于使
    的头像 发表于 07-10 18:24 1478次阅读

    计算机视觉与人工智能的关系是什么

    引言 计算机视觉是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域的知识。人工智能则是研究如何使计算
    的头像 发表于 07-09 09:25 479次阅读

    计算机视觉和机器视觉区别在哪

    计算机视觉和机器视觉是两个密切相关但又有明显区别的领域。 一、定义 计算机视觉 计算机
    的头像 发表于 07-09 09:22 372次阅读

    计算机视觉属于人工智能吗

    属于,计算机视觉是人工智能领域的一个重要分支。 引言 计算机视觉是一门研究如何使计算机具有视觉
    的头像 发表于 07-09 09:11 1006次阅读

    机器视觉计算机视觉的区别

    在人工智能和自动化技术的快速发展,机器视觉(Machine Vision, MV)和计算机视觉(Computer Vision, CV)作为两个重要的分支领域,都扮演着至关重要的角色
    的头像 发表于 06-06 17:24 1167次阅读

    计算机视觉的主要研究方向

    计算机视觉(Computer Vision, CV)作为人工智能领域的一个重要分支,致力于使计算机能够像人眼一样理解和解释图像和视频的信息。随着深度学习、大数据等技术的快速发展,
    的头像 发表于 06-06 17:17 762次阅读

    计算机视觉的十大算法

    随着科技的不断发展,计算机视觉领域也取得了长足的进步。本文将介绍计算机视觉领域的十大算法,包括它们的基本原理、应用场景和优缺点。这些算法在图像处理、目标检测、人脸识别等领域有着广泛的应
    的头像 发表于 02-19 13:26 1167次阅读
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的十大算法

    机器视觉、工业视觉计算机视觉这三者的关系

    机器视觉、工业视觉计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 1141次阅读
    机器<b class='flag-5'>视觉</b>、工业<b class='flag-5'>视觉</b>和<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>这三者的关系

    工业视觉计算机视觉的区别

    工业视觉主要解决以往需要人眼进行的工件的定位、测量、检测等重复性劳动;计算机视觉的主要任务是赋予智能机器人视觉,利用测距、物体标定与识别等功能实现对于外界位置信息、图像信息等的识别与判
    发表于 01-16 10:06 512次阅读
    工业<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的区别

    双目立体视觉是什么样的技术?

    双眼视物时,主观上可产生被视物体的厚度以及空间的深度或距离等感觉,称为立体视觉(stereopsis)。其主要原因是同一被视物体在两眼视网膜上的像并不完全相同,左眼从左方看到物体的左侧面较多,而右眼则从右方看到物体的右侧面较多。
    的头像 发表于 12-28 17:08 1001次阅读
    <b class='flag-5'>双目</b><b class='flag-5'>立体视觉</b>是什么样的技术?

    计算机视觉立体视觉和深度感知Python示例实现

    在人工智能和图像处理的迷人世界,这些概念在使机器能够像我们的眼睛一样感知我们周围的三维世界起着关键作用。和我们一起探索立体视觉和深度感知背后的技术,揭示计算机如何从二维图像
    的头像 发表于 11-21 10:50 588次阅读

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-16 16:38 4396次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    最适合AI应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-15 16:38 406次阅读
    最适合AI应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?