机器“视觉”像人类一样“看”世界-电子发烧友网

深度学习中的技术进展帮助机器能像人类一样“看”世界，这是人工智能研究中最具吸引力的部分之一。目前，一种突破性技术将让机器能够通过被称为球面卷积神经网络（spherical Convolutional Neural Networks，缩写CNNs）的处理，去看到并识别三维空间中的物体。从识别极小分子的机器到分析外太空最庞大结构的工具，我们对这项新发现的能力所能实现的种种可能的想象才刚刚开始。当然，这其中还包括了许多介乎两者之间的用例，比如指导机器人在人群中安全导航。

正如最近这次获奖所展现的，该研究领域是人工智能（AI）发展的前沿领域。Qualcomm Technologies荷兰研究人员Taco Cohen和Max Welling及其合作伙伴，通过与阿姆斯特丹大学联合撰写的《球面CNNs》论文荣获“国际学习表征大会（ICLR：International Conference for Learning Representations）2018年度最佳论文奖”。ICLR主要发布人工智能（AI）和机器学习方面的最新研究，现已举办到第六届。

蒙特利尔大学的Yoshua Bengio和纽约大学／Facebook的Yann LeCun共同担任ICLR 2018的主席。在全球顶尖AI实验室提交的约1，000篇投稿中，AI领域最具创新性和影响力的研究被授予最佳论文奖的殊荣。

该球面CNN论文引入了构建CNNs的新型数学架构，可鲁棒地分析球面图像，并不会受到曲面失真的影响。这是因为：球面CNN具有针对旋转的“等变”特性，它意味着该网络学习到的内部表征会与输入信息同步旋转。从实验的结果来看，球面CNNs在两项截然不同的任务上可实现出色的预测精度：球面图像3D模型识别和原子化能量预测（一项重要的化学问题）。

球面CNNs为什么重要

为了理解球面CNNs的重要性，我们介绍一些背景：过去几年，深度学习——尤其是CNNs——已彻底变革了AI，语音识别、视觉对象识别、自然语言处理及其他领域均出现突破性成果。

CNNs很擅长分析线性信号，例如音频或文本、图像、或视频，因其具备可识别模式的内在能力，而不管其空间或时间位置如何。这能支持CNNs学习并识别如视觉对象，无论它在图像中位于什么位置，并无需在深度学习模型训练阶段观看同一对象的多个移动版本。

但在最近受到关注的多个应用中，我们都希望学习的信号留存在球体上，如汽车、无人机和其他机器人拍摄其整个周边环境的球面图像所使用的全向摄像头。在科学应用中也存在大量球面信号，从地球科学到天体物理学都有相关案例。

分析此类球面信号的一个方法是把信号投影到平面上，并借助CNN来分析结果。但根据制图学，任何此类“地图投影”都会导致扭曲失真，让部分区域看起来比实际尺寸更大或更小。这会使CNN变得无效，因为随着对象在球体上移动，它们看上去不仅只是在地图上移动，而且还会显得缩小和拉伸。

如何使用球面CNNs

球面CNNs在物联网（IoT）、机器人、自动驾驶汽车、增强现实（AR）和虚拟现实（VR）领域都有诸多应用。如今，自动驾驶无人机已向消费者出售，或许有一天它将能在几分钟内把包裹送到你的家门口，这就是球面CNNs可改善物体侦测与识别，以及视觉运动分析的一个自然应用。在AR方面，一整组摄像头所拍摄的360度房间全景可融入至单球面图像中，借助球面CNN的高效分析，精确覆盖虚拟物体。

Qualcomm对此项工作可能带来的上述应用和其他转换应用倍感兴奋，我们也正在积极推动此项研究及其他数据高效学习研究。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47314

浏览量
238667
深度学习

深度学习

+关注

关注
73

文章
5503

浏览量
121207

原文标题：探索机器“视觉”演进的无限可能性

文章出处：【微信号：AItists，微信公众号：人工智能学家】欢迎添加关注！文章转载请注明出处。

【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线

一、什么是计算机视觉？计算机视觉，其实就是教机器怎么像我们人一样，用摄像头看看周围的世界，然后理

发表于 10-31 17:00 •415次阅读

【小白入门必看】<b class='flag-5'>一</b>文读懂深度学习计算机<b class='flag-5'>视觉</b>技术及学习路线

解锁机器人视觉与人工智能的潜力，从“盲人机器”改造成有视觉能力的机器人（上）

正如人类依赖眼睛和大脑来解读世界，机器人也需要自己的视觉系统来有效运作。没有视觉，机器人就如同蒙

发表于 10-12 09:56 •413次阅读

解锁<b class='flag-5'>机器</b>人<b class='flag-5'>视觉</b>与人工智能的潜力，从“盲人<b class='flag-5'>机器</b>”改造成有<b class='flag-5'>视觉</b>能力的<b class='flag-5'>机器</b>人（上）

请问studio中可以像裸机一样调用定时器中断吗？

studio中可以像裸机一样调用定时器中断吗？我调用后显示出错了，使用hal库还需要添加什么吗

发表于 09-13 08:18

视觉检测是什么意思?机器视觉检测的适用行业及场景有哪些?

在快速迭代的工业世界中，机器视觉检测以其精准、高效的力量，已成为众多产业不可或缺的技术支持。本文将深入探讨机器视觉检测的含义、应用行业及具体

发表于 08-30 11:20 •380次阅读

Stem32CubeIDE能像Keil一样指定不同文件下的代码编译吗？

Stem32CubeIDE能像Keil一样指定不同文件下的代码编译

发表于 07-23 06:22

opencv-python和opencv一样吗

不一样。OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，它提供了大量的图像和视频处理功能。OpenCV-P

发表于 07-16 10:38 •1217次阅读

什么是机器视觉opencv?它有哪些优势?

机器视觉（Machine Vision）是一种利用计算机和图像处理技术来模拟人类视觉系统的功能，实现对图像的识别、分析和理解的技术。Open

发表于 07-16 10:33 •797次阅读

机器视觉的应用实例解析

机器视觉是一种利用计算机视觉技术对图像进行处理、分析和理解的技术。它在许多领域都有广泛的应用，包括工业自动化、医疗诊断、交通监控、安全监控等。一

发表于 07-16 10:19 •472次阅读

计算机视觉和机器视觉区别在哪

计算机视觉和机器视觉是两个密切相关但又有明显区别的领域。一、定义计算机视觉计算机视觉是

发表于 07-09 09:22 •459次阅读

锰芯磁环电感尺寸一样性能也一样吗

电子发烧友网站提供《锰芯磁环电感尺寸一样性能也一样吗.docx》资料免费下载

发表于 06-03 14:52 •0次下载

Meta高管称大语言模型永远无法像人类一样

Meta的人工智能主管杨立昆近日表示，尽管ChatGPT等生成式人工智能产品备受瞩目，但其背后的大型语言模型（LLM）永远无法实现像人类一样的推理和计划能力。

发表于 05-27 09:50 •442次阅读

stm8cube不能像stm32cube一样来自动生成工程吗？怎么操作？

stm8cube不能像stm32cube一样来自动生成工程吗？有知道怎么操作的吗？

发表于 05-07 08:01

如何把外部SRAM像内部RAM一样分配变量？

各位大神，外部SRAM怎样配置才能像内部SRAM一样分配变量，要编译器分配。我使用的是GCC，SRAM现在可以读写，但是就是不知道怎么修改链接脚本和启动文件。

发表于 04-08 08:32

大牛谈如何学习机器视觉?

国内外机器视觉发展的不同。我本人认为，只有先搞清了两边的不一样，才便于说清如何下手学习。国外机器视觉发展到今天，已经从“

发表于 01-15 11:02 •453次阅读

二维图片框在鼠标处滚轮缩放图片，像 CAD 一样，，

大家好，如何实现，二维图片框在鼠标处滚轮缩放图片，像 CAD 一样，，*附件：图片在鼠标处缩放.rar

发表于 01-07 21:02

搜索历史

机器“视觉”像人类一样“看”世界

评论

【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线

解锁机器人视觉与人工智能的潜力，从“盲人机器”改造成有视觉能力的机器人（上）

请问studio中可以像裸机一样调用定时器中断吗？

视觉检测是什么意思?机器视觉检测的适用行业及场景有哪些?

Stem32CubeIDE能像Keil一样指定不同文件下的代码编译吗？

opencv-python和opencv一样吗

什么是机器视觉opencv?它有哪些优势?

机器视觉的应用实例解析

计算机视觉和机器视觉区别在哪

锰芯磁环电感尺寸一样性能也一样吗

Meta高管称大语言模型永远无法像人类一样

stm8cube不能像stm32cube一样来自动生成工程吗？怎么操作？

如何把外部SRAM像内部RAM一样分配变量？

大牛谈如何学习机器视觉?

二维图片框在鼠标处滚轮缩放图片，像 CAD 一样，，