0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三维视觉将成为人工智能的“杀手级应用”

MEMS 来源:未知 作者:伍文辉 2018-04-03 11:04 次阅读

Google人工智能机器学习首席科学家李飞飞在Google I/O开发者大会表示人工智能将成为“第四次工业革命的驱动力”,它将改变人类生活、工作和沟通的方式。在人工智能的三个阶段“弱人工智能—强人工智能—超人工智能”的发展中,视觉信息的获取是必不可少的,机器从对物体的识别到场景的理解都必须先获取其三维信息以及位置关系。三维视觉将成为人工智能的“杀手级应用”。

在过去十年间,人类在对图像识别和图像标注等基础视觉领域已经取得了重大进展,基于这种二维图像视觉在诸如人脸识别、工业检测、安防以及汽车ADAS等方面得到了广泛的应用,成为人工智能的一些重要落地应用。随着人工智能的发展,二维信息无法满足对真实场景的充分理解,所以各个大厂都在着力研究三维视觉的技术,如Intel的RealSense、Apple的TrueDepth,以及诸多厂家面向无人驾驶的多线激光雷达等,这些技术都在帮助机器获取一个至关重要信息——深度信息,来实现三维人脸识别、手势识别、获知物体间的空间关系,以及视觉导航、路径规划、主动避障等工作。

三维视觉在强人工智能阶段必将是不可获取的组成部分,是机器智能和企业变革的重要技术。接下来我们就三维视觉的技术方案给做一个系统介绍。

其中三角测距中的非编码方式的方案常见于工业检测领域,这种方案我们暂且不讨论。我们在这一期着重讨论其它几种方式的近距离三维视觉方案。

近距离三维感知设备我们称之为深度相机,其中双目相机即是利用双摄像头模拟人眼,通过计算空间中同一个物体在两个相机成像的视差来获得物体离相机的距离。

而ToF(Time of Flight)即飞行时间法,其测距原理是通过连续发射经过调制的特定频率的光脉冲到被观测物体上,然后接收从物体反射回去的光脉冲,通过探测光脉冲的飞行(往返)时间来计算被测物体离相机的距离。

三角法测距中的采用编码方式的方案业内均定义为结构光方式。结构光法不依赖于物体本身的颜色和纹理,是采用主动投影编码图案(比如散斑、条纹光等)的方法来实现快速鲁棒的匹配特征点,能够获得较高的精度,也大大扩展了适用范围。

苹果iPhone X的“齐刘海”——TrueDepth系统

iPhone X通过前置点阵投影器(也就是结构光投影仪)将超过30000个肉眼不可见的光点(红外激光散斑点)投影到人脸,再根据红外镜头接收到的反射光点,计算得到人脸三维图。

这种空间编码方式,是向空间投射了单幅随机的激光衍射斑点,但是由于这些点并不能覆盖空间上所有的区域,势必在某些位置无法获取到三维信息,导致其精度是有一定限制的,通常为毫米级精度,这也是为什么iPhone X只是获取了人脸的大致模型,在其FaceID应用中实际上只是应用了结构光方案判断解锁手机的是一个真实的人,而非平面照片或视频,作为一种活体判断防止被攻击破解的手段。

这类散斑结构光的方案被国内奥比中光、华捷艾米等企业采用。主要应用于体感交互、手势识别、人脸识别活体检测等领域。

那是否有方案可以实现高精度的三维数据呢?答案是肯定的。这就是我们接下来要讲的动态结构光的时间编码方案,此种方案的深度相机的原理如下:

它同样由一个摄像机和一个结构光投影仪组成,结构光投影仪向被测物体投射多组明暗相间的光栅图像(随时间可调制),摄像机同时拍摄经被测物体表面调制而变形的多组光栅图像,通过一定算法计算出被测物体的三维数据。

这种动态结构光方案的三维视觉其实在工业界早有应用,主要应用在逆向工程、三维检测、三维建模等领域,这就是传统的三维扫描仪,既然将它称为仪器,也就可想而知其体积通常比较大,价格也很昂贵。

那是否存在一种深度相机方案,其精度高,体积小,价格也不那么高呢?答案也是肯定的。这个就是MEMS微振镜的方案(MEMS:微机电系统)。MEMS微振镜是一种将可动结构芯片化的执行器,工作时芯片内部的镜面可以高速摆动,以实现激光束的高速扫描。

基于MEMS微振镜的深度相机与传统的三维扫描仪最大的区别是结构光投影方式上,三维扫描仪采用DLP、LCOS等进行动态结构光的投影,而此深度相机是采用MEMS微振镜与激光来进行扫描投影。

采用MEMS微振镜的投影方式,不仅克服了体积和成本上的缺点,同时由于这种投影系统是激光扫描式,投影并无光学放大镜头,也就没有焦距的概念,是一个无需调焦的系统(free-focus projector),这也就使得基于MEMS微振镜深度相机的工作范围要比三维扫描仪要大很多。

基于MEMS微振镜的深度相机可以实现亚毫米级,甚至更高的深度精度,相比较同样小体积的散斑静态结构光方案的深度相机,精度提升有至少一个数量级。而相比同样精度的三维扫描仪,其体积小、重量轻、无需调焦等优势特点扩展了高精度三维视觉的应用场景。

以下将结构光的三维视觉方案做一个综合对比:

MEMS深度相机所采集的亚毫米精度数据可以满足三维人脸识别需求,实现真正用三维数据来作为识别判定依据。而非像iPhoneX中三维信息只能用于活体判断,也避免出现如新闻中所报道的母子二人均可解锁iPhone X的情况。

同时这种高精度深度相机所采用的MEMS微振镜尺寸通常只有几个毫米,功耗也只有几十毫瓦,非常适合集成于如智能手机、平板电脑等便携式的设备中,为其增加三维人脸识别、三维扫描建模等功能。目前采用这种技术方案的国内外厂家有Intel的RealSense,知微传感(Zhisensor)的Argus等。

随着人工智能对视觉传感器的需求越来越高,高精度的三维视觉产品也将会越来越普及,在不远的将来,机器拥有比人类更敏锐的视觉感知的确是完全可能的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • iPhone X
    +关注

    关注

    0

    文章

    79

    浏览量

    6373
  • 三维视觉
    +关注

    关注

    1

    文章

    16

    浏览量

    1751

原文标题:比iPhone X更牛X的三维视觉技术

文章出处:【微信号:MEMSensor,微信公众号:MEMS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    三维扫描与建模的区别 三维扫描在工业中的应用

    三维扫描与建模的区别 三维扫描与建模是两种不同的技术,它们在操作过程、输出结果及应用领域上存在显著的区别。 操作过程 : 三维扫描 :主要通过激光或光学扫描设备,获取实物表面的形状、纹理信息等
    的头像 发表于 12-19 14:55 159次阅读

    嵌入式和人工智能究竟是什么关系?

    、连接主义和深度学习等不同的阶段。目前,人工智能已经广泛应用于各种领域,如自然语言处理、计算机视觉智能推荐等。 嵌入式系统和人工智能在许多方面都存在密切的关联性。首先,嵌入式系统可
    发表于 11-14 16:39

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    农业、环保等,为人类社会的可持续发展做出贡献。 总结 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们展示了一个充满希望和机遇的未来。在这个未来中,人工智能将成为
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    周末收到一本新书,非常高兴,也非常感谢平台提供阅读机会。 这是一本挺好的书,包装精美,内容详实,干活满满。 《AI for Science:人工智能驱动科学创新》这本书的第一章,作为整个著作的开篇
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    长时间运行或电池供电的设备尤为重要。 高性能 : 尽管RISC-V架构以低功耗著称,但其高性能也不容忽视。通过优化指令集和处理器设计,RISC-V可以在处理复杂的人工智能图像处理任务时表现出色。
    发表于 09-28 11:00

    友思特方案 基于三维点云实现PCB装配螺丝视觉检测

    三维点云是完成精密化 PCB 检测的最新视觉技术。友思特 Saccde Vision 视觉扫描系统,采用先进的三维成像技术和算法输出直观点云图,进一步确保了PCB生产的可靠性与稳定性能
    的头像 发表于 08-28 16:35 302次阅读
    友思特方案  基于<b class='flag-5'>三维</b>点云实现PCB装配螺丝<b class='flag-5'>视觉</b>检测

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    呈现、产业展览、技术交流、学术论坛于一体的世界人工智能合作交流平台。本次大会暨博览会由工业和信息化部政府采购中心、广东省工商联、前海合作区管理局、深圳市工信局等单位指导,深圳市人工智能产业协会主办
    发表于 08-22 15:00

    FPGA在人工智能中的应用有哪些?

    定制化的硬件设计,提高了硬件的灵活性和适应性。 综上所述,FPGA在人工智能领域的应用前景广阔,不仅可以用于深度学习的加速和云计算的加速,还可以针对特定应用场景进行定制化计算,为人工智能技术的发展提供有力支持。
    发表于 07-29 17:05

    三维可视化的魅力与应用

    三维可视化是一种强大的工具,它融合了艺术、科学和技术,通过在三维空间中呈现数据、概念和想法,为人们提供了一种直观而生动的方式来理解和探索信息。这项技术在当今世界中的应用非常广泛,涵盖了科学、教育
    的头像 发表于 07-17 14:19 263次阅读

    机器视觉人工智能的关系与应用

    机器视觉人工智能的关系是一个广泛而深入的话题,涉及到计算机科学、电子工程、光学、图像处理、模式识别等多个领域。 一、机器视觉人工智能的定义 机器
    的头像 发表于 07-16 10:27 932次阅读

    三维可视:展现未来的视觉盛宴

    带你了解这一领域的种种奇迹。 一、三维可视化技术的定义 三维可视化技术是基于计算机图形学和计算机视觉的一种技术,用于创建和呈现逼真的三维场景。通过使用复杂的算法和图像处理技术,它能够模
    的头像 发表于 06-05 15:48 329次阅读

    激光距离选通三维成像技术研究进展综述

    随着人工智能(AI)时代的到来,同时获得反映目标辐射特性和纹理特征的高分辨率强度图像以及反映目标和所处场景的三维空间信息的稠密点云数据/三维图像的激光相机雷达技术已成为激光雷达的发展趋
    的头像 发表于 05-28 10:26 3027次阅读
    激光距离选通<b class='flag-5'>三维</b>成像技术研究进展综述

    泰来三维|文物三维扫描,文物三维模型怎样制作

    文物三维扫描,文物三维模型怎样制作:我们都知道文物是不可再生的,要继续保存传承,需要文物三维数字化保护,所以三维数字化文物保护是非常重要的一个技术手段。 那么文物
    的头像 发表于 03-12 11:10 628次阅读
    泰来<b class='flag-5'>三维</b>|文物<b class='flag-5'>三维</b>扫描,文物<b class='flag-5'>三维</b>模型怎样制作

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能领域布局
    发表于 02-26 10:17

    三维视觉测量技术知识科普

    三维视觉测量技术按照测量过程中是否投射光源,获取被测物体三维形貌信息的方法可以分为两大类: 被动视觉测量和主动视觉测量。
    的头像 发表于 01-03 11:47 848次阅读
    <b class='flag-5'>三维</b><b class='flag-5'>视觉</b>测量技术知识科普