探索机器“视觉”演进的无限可能性 Qualcomm AI研究人员获得ICLR殊荣-电子发烧友网

Qualcomm AI研究人员获得ICLR殊荣：“球面卷积神经网络（spherical Convolutional Neural Networks，缩写CNNs）”荣获ICLR 2018年度最佳论文奖。

深度学习中的技术进展帮助机器能像人类一样“看”世界，这是人工智能研究中最具吸引力的部分之一。目前，一种突破性技术将让机器能够通过被称为球面卷积神经网络（spherical Convolutional Neural Networks，缩写CNNs）的处理，去看到并识别三维空间中的物体。从识别极小分子的机器到分析外太空最庞大结构的工具，我们对这项新发现的能力所能实现的种种可能的想象才刚刚开始。当然，这其中还包括了许多介乎两者之间的用例，比如指导机器人在人群中安全导航。

正如最近这次获奖所展现的，该研究领域是人工智能（AI）发展的前沿领域。Qualcomm Technologies荷兰研究人员Taco Cohen和Max Welling及其合作伙伴，通过与阿姆斯特丹大学联合撰写的《球面CNNs》论文荣获“国际学习表征大会（ICLR：International Conference for Learning Representations）2018年度最佳论文奖”。ICLR主要发布人工智能（AI）和机器学习方面的最新研究，现已举办到第六届。蒙特利尔大学的Yoshua Bengio和纽约大学/Facebook的Yann LeCun共同担任ICLR 2018的主席。在全球顶尖AI实验室提交的约1，000篇投稿中，AI领域最具创新性和影响力的研究被授予最佳论文奖的殊荣。

该球面CNN论文引入了构建CNNs的新型数学架构，可鲁棒地分析球面图像，并不会受到曲面失真的影响。这是因为：球面CNN具有针对旋转的“等变”特性，它意味着该网络学习到的内部表征会与输入信息同步旋转。从实验的结果来看，球面CNNs在两项截然不同的任务上可实现出色的预测精度：球面图像3D模型识别和原子化能量预测（一项重要的化学问题）。

球面CNNs为什么重要

为了理解球面CNNs的重要性，我们介绍一些背景：过去几年，深度学习——尤其是CNNs——已彻底变革了AI，语音识别、视觉对象识别、自然语言处理及其他领域均出现突破性成果。CNNs很擅长分析线性信号，例如音频或文本、图像、或视频，因其具备可识别模式的内在能力，而不管其空间或时间位置如何。这能支持CNNs学习并识别如视觉对象，无论它在图像中位于什么位置，并无需在深度学习模型训练阶段观看同一对象的多个移动版本。但在最近受到关注的多个应用中，我们都希望学习的信号留存在球体上，如汽车、无人机和其他机器人拍摄其整个周边环境的球面图像所使用的全向摄像头。在科学应用中也存在大量球面信号，从地球科学到天体物理学都有相关案例。

分析此类球面信号的一个方法是把信号投影到平面上，并借助CNN来分析结果。但根据制图学，任何此类“地图投影”都会导致扭曲失真，让部分区域看起来比实际尺寸更大或更小。这会使CNN变得无效，因为随着对象在球体上移动，它们看上去不仅只是在地图上移动，而且还会显得缩小和拉伸。

如何使用球面CNNs

球面CNNs在物联网（IoT）、机器人、自动驾驶汽车、增强现实（AR）和虚拟现实（VR）领域都有诸多应用。如今，自动驾驶无人机已向消费者出售，或许有一天它将能在几分钟内把包裹送到你的家门口，这就是球面CNNs可改善物体侦测与识别，以及视觉运动分析的一个自然应用。在AR方面，一整组摄像头所拍摄的360度房间全景可融入至单球面图像中，借助球面CNN的高效分析，精确覆盖虚拟物体。

Qualcomm对此项工作可能带来的上述应用和其他转换应用倍感兴奋，我们也正在积极推动此项研究及其他数据高效学习研究。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28476

浏览量
207400
AI

AI

+关注

关注
87

文章
31028

浏览量
269368
Qualcomm

Qualcomm

+关注

关注
8

文章
674

浏览量
52153
深度学习

深度学习

+关注

关注
73

文章
5506

浏览量
121255

【「具身智能机器人系统」阅读体验】+初品的体验

解决许多技术的和非技术的挑战，如提高智能体的自主性、处理复杂环境互动的能力及确保行为的伦理和安全性。未来的研究需要将视觉、语音和其他传感技术与机器

发表于 12-20 19:17

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

复杂环境互动的能力及确保行为的伦理和安全性。未来的研究需要将视觉、语音和其他传感技术与机器人技术结合，探索更加先进的知识表示和记忆模块，利

发表于 11-11 10:20

车路协同——探索智慧路灯系统的无限可能

车路协同——探索智慧路灯系统的无限可能

发表于 11-07 12:40 •193次阅读

智慧综合杆路灯与物联网融合与发展车路协同——探索智慧路灯系统的无限可能

智慧综合杆路灯与物联网融合与发展车路协同——探索智慧路灯系统的无限可能

发表于 10-29 16:24 •349次阅读

AI干货补给站 | 深度学习与机器视觉的融合探索

在智能制造的浪潮中，阿丘科技作为业界领先的工业AI视觉平台及解决方案提供商，始终致力于推动AI+机器视觉技术的革新与应用。为此，我们特别开设

发表于 10-29 08:04 •233次阅读

探索住宅动态IP：连接世界的无限可能

住宅动态IP，作为现代家庭网络的重要组成部分，其不断变化的特性为用户带来了诸多便利和可能性。

发表于 10-21 07:50 •137次阅读

AI如何对产品设计带来更多的可能性？

AI(人工智能)对产品设计带来了广泛而深远的可能性，这些可能性主要体现在以下几个方面 1.创新设计的激发创意生成:AI能够学习和模仿人类设计师的创作过程，通过深度学习等技术生成全新的

发表于 10-15 11:29 •261次阅读

高通探索收购英特尔芯片设计业务的可能性

在科技行业并购传闻频发的背景下，高通公司被曝已探索收购英特尔部分业务的可能性，特别是其客户端PC芯片设计业务，旨在进一步丰富和增强其产品组合。据多位知情人士透露，高通对英特尔的这部分资产表现出浓厚兴趣，而英特尔则正积极寻求现金流，考虑剥离非核心业务及出售资产以优化财务结构

发表于 09-09 17:21 •587次阅读

谷歌研究人员推出革命性首个AI驱动游戏引擎

在科技日新月异的今天，人工智能（AI）正以前所未有的速度渗透到我们生活的每一个角落，从自动驾驶汽车到智能家居，无一不彰显着其巨大的潜力和无限可能。而最近，谷歌研究团队的一项突破

发表于 08-29 17:21 •545次阅读

新思科技探索AI+EDA的更多可能性

芯片设计复杂性的快速指数级增长给开发者带来了巨大的挑战，整个行业不仅要向埃米级发展、Muiti-Die系统和工艺节点迁移所带来的挑战，还需要应对愈加紧迫的上市时间目标、不断增加的制造测试成本以及人才短缺等问题。早在AI大热之前，芯片设计行业就把目光放到了

发表于 08-29 11:19 •524次阅读

苹果积极探索为Apple Watch SE引入塑料表壳的可能性

8月7日，国际媒体传来新消息，据知情人士透露，苹果公司正积极探索为即将推出的Apple Watch SE系列引入塑料表壳的可能性，此举旨在通过材料创新进一步压缩成本，增强市场竞争力。这一变化不仅预示着成本效益的显著提升，还可能开

发表于 08-07 17:03 •615次阅读

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》2.0

、自然语言处理感兴趣的研究人员、工程师以及学生阅读。无论是初学者还是有一定基础的专业人士，都能从中获得有价值的信息。

发表于 05-07 10:30

视觉机器人焊接的研究现状

视觉机器人焊接技术是将计算机视觉与机器人技术相结合，实现自动焊接过程中的实时检测、跟踪和控制。这一领域的研究一直处于不断发展之中，吸引了众多

发表于 04-02 15:34 •538次阅读

基础模型能为机器人带来怎样的可能性？

机器人是一种拥有无尽可能性的技术，尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑，帮助机器人感知和理

发表于 01-26 14:47 •236次阅读

NVIDIA Jetson为嵌入式计算领域探索AI可能

自动化业务流程、通过数据分析获得洞察力、与客户和员工互动……如今 AI 正在大幅提高生产力，推动竞争优势。NVIDIA Jetson 是适用于自主机器和其他嵌入式应用的先进平台，具有出色的 A

发表于 01-25 17:03 •550次阅读