DeepMind论文推出了一种新的神经网络—

编者按：今天，DeepMind的研究人员在Science上发表论文，推出了一种新的神经网络——GQN，只用几张二维照片，就能重建全部的三维场景，可以说是计算机视觉领域的又一关键突破。

让机器对空间环境进行感知似乎一直是DeepMind研究的重点，一个多月前我们曾报道过他们的另一项研究：DeepMind用AI解密大脑：当你找路时，大脑发生了什么。空间感知对人类来说很简单，例如当我们第一次走进一个房间，扫一眼就能知道屋里有哪些物品、它们都在哪个位置上。只看到桌子的三条腿，你也能推断出第四条腿的大致位置和形状。另外，即使你没有熟悉屋里的每个角落，也能大概描绘出它的平面图，或者能想象出从另一个角度看房间应该是什么样子的。

但是想让人工智能系统做到上述行为的确很困难。现在最先进的计算机视觉系统仍需要在大型经过标注的数据集上进行训练，而数据标注又是一项费时费力的工作，所以每次模型只能捕捉一小部分场景。随着网络越来越复杂，想详细了解的周围环境也越复杂：最近的座位在哪？沙发是什么材质的？所有影子的光源在哪？照明开关可能在哪？

在这次的研究中，DeepMind研究人员介绍了一种能感知周围环境的框架——GQN（Generative Query Network）。和婴儿或动物一样，GQN通过观察周围环境收集数据，从而学习，无需人类对场景进行标记，就能掌握大致空间结构。

GQN模型由两部分组成：一个表示网络和一个生成网络。表示网络将智能体所观察到的画面作为输入，生成一个表示（向量），描述了基本场景。之后，生成网络从此前没有观察到的角度对场景进行预测（或者说是“想象”）。

但是表示网络并不知道生成网络要从哪个视角预测场景，所以它必须找到一种高效、精确的描绘场景平面的方法。它通过捕捉最重要的元素，例如物体的位置、颜色和房间平面，进行简单表示。训练期间，生成器学习辨认物体、特征、关系和环境的规律。这一套“共享”的概念让表示网络能用一种高度简练、抽象的方式描绘场景，剩余的细节部分就由生成网络补充。例如，表示网络用一小串数字表示一个“蓝色方块”，生成网络就知道从某个角度应该如何用像素展现出来。

DeepMind研究人员在程序生成的虚拟3D环境中对GQN做了多次试验，包括多种不同物体，被摆放在不同的位置，并且形状、颜色、材质都不相同，同时还改变了光线方向和遮挡程度。通过在这些环境上进行训练，他们用GQN的表示网络去生成一个从未见过的场景。在实验中人们发现GQN展现出了几个重要特征：

GQN的生成网络可以在全新视角“想象”出此前没有见过的景象，精确度非常高。给定一个场景表示和新的相机角度，网络不需要任何先前信息就能生成精确的图像。所以生成网络也可以近似看成是从数据中学习的渲染器：

GQN的表示网络可以独自学习算数、定位、分类物体。就算在小型表示上，GQN也能在具体视角上做出非常精准的预测，和现实几乎一模一样。这说明了表示网络观察得非常仔细，例如下面这个由几个方块堆叠起来的场景：

GQN可以表示、测量并且减少不确定性。即使在没有完全看到所有场景的情况下，网络也可以解释其中的不确定之处。同时也能根据部分图像拼成完整的场景。下面的第一人称视角和自上而下的预测方法就是其中的“秘诀”。模型通过它预测的变化性表达不确定性，其中预测的变化性随着不断在迷宫中移动减少（灰色三角是观察位置）。

GQN表示支持稳定、数据高效的强化学习。给定GQN表示后，目前顶尖的深度强化学习智能体就开始学习以数据有效的方式完成任务。对这些智能体来说，生成网络中编入的信息可以看作是对环境固有的认知：

利用GQN我们观察到了更多数据有效的学习，比通常只利用原始像素的方法快了近4倍达到收敛水平

相较于前人研究，GQN是一种全新的学习现实场景的简单方法。重要的是，这种方法不需要对具体场景建模，或者花大量时间对内容标注，一个模型就能应用多个场景。它还学习了一种强大的神经渲染器，能够在任意角度生成精确的场景图像。

不过，与一些传统计算机视觉技术相比，这次所提出的方法仍然有很多限制，并且目前也都是在虚拟的合成场景上训练的。不过，随着更多可用数据的出现以及硬件的提升，研究人员希望进一步套索GQN的可能性，比如将它应用到现实场景中，同时提高成像分辨率。未来，研究GQN对更广泛的场景理解非常重要，例如加入时间的维度，让它学习对场景和移动的理解，同时应用到VR和AR技术中。尽管前路漫漫，这项工作对全自动场景辨别来说是重要一步。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4789

浏览量
101549
计算机视觉

计算机视觉

+关注

关注
8

文章
1702

浏览量
46228
数据集

数据集

+关注

关注
4

文章
1212

浏览量
24970

原文标题：DeepMind重磅论文：不用人类标记，几张图片就能渲染出3D场景

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

人工神经网络原理及下载

人工神经网络是根据人的认识过程而开发出的一种算法。假如我们现在只有一些输入和相应的输出，而对如何由输入得到输出的机理并不清楚，那么我们可以把输入与输出之间的未知过程看成是一个“

发表于 06-19 14:40

【PYNQ-Z2试用体验】神经网络基础知识

学习和认知科学领域，是一种模仿生物神经网络（动物的中枢神经系统，特别是大脑）的结构和功能的数学模型或计算模型，用于对函数进行估计或近似。神经网络由大量的人工

发表于 03-03 22:10

【案例分享】ART神经网络与SOM神经网络

是一种常用的无监督学习策略，在使用改策略时，网络的输出神经元相互竞争，每一时刻只有一个竞争获胜的神经

发表于 07-21 04:30

人工神经网络实现方法有哪些？

人工神经网络(Artificial Neural Network，ANN)是一种类似生物神经网络的信息处理结构，它的提出是为了解决一些非线性，非平稳，复杂的实际问题。那有哪些办法能实现

发表于 08-01 08:06

神经网络结构搜索有什么优势？

，稍有不同就无法复现论文的结果。而网络结构作为一种特殊的超参数，在深度学习整个环节中扮演着举足轻重的角色。在图像分类任务上大放异彩的ResNet、在机器翻译任务上称霸的Transformer等

发表于 09-11 11:52

如何构建神经网络？

原文链接：http://tecdat.cn/?p=5725 神经网络是一种基于现有数据创建预测的计算系统。如何构建神经网络？神经网络包括：输入层：根据现有数据获取输入的层隐藏层：使用反

发表于 07-12 08:02

一种基于综合几何特征和概率神经网络的HGU轴轨识别方法

摘要故障诊断是保证水轮发电机组安全运行的重要环节。轴心轨迹辨识是HGU故障诊断的一种有效方法。提出了一种基于综合几何特征和概率神经网络（CGC-PNN）的HGU轴轨识别方法。该方法从结

发表于 09-15 08:18

一种基于高效采样算法的时序图神经网络系统介绍

成为了非常重要的问题。基于以上问题，本文提出了一种基于高效采样算法的时序图神经网络系统。首先我们介绍用于时序图神经网络采样的高效采样方法。采样常常被用于深度学习中以降低模型的训练时

发表于 09-28 10:34

一种基于PID神经网络的解耦控制方法的研究

为了消除造纸工业抄纸过程中存在的解耦问题，提出了一种基于PID 神经网络的解耦方法。文章在介绍PID 神经网络原理的基础上，给出了二变量PI

发表于 06-15 10:10 •19次下载

一种基于人工神经网络的秘密共享方案

本文首先分析了人工神经网络和秘密共享的相通之处，阐明了用人工神经网络来实现秘密共享是可能的；其次给出了一种基于人工神经网络的秘密共享的门限方

发表于 08-15 09:54 •15次下载

一种改进的BP神经网络调制分类器

本文致力于基于神经网络的通信信号调制类型识别器设计研究。论文提出了一种改进的BP神经网络分类器，它采用7个特征参数，可以对CW、2FSK、4

发表于 08-29 10:22 •10次下载

Google AI子公司开发出一个神经网络GQN，其组成部分介绍

Google AI 子公司 DeepMind 开发出一个神经网络，能根据一张 2D 图像“想象出”它的 3D 场景。该系统被称为Generative Query Network （

发表于 06-29 16:54 •6970次阅读

一种新型神经网络结构：胶囊网络

胶囊网络是 Geoffrey Hinton 提出的一种新型神经网络结构，为了解决卷积神经网络（ConvNets）的一些缺点，提

发表于 02-02 09:25 •5975次阅读

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

深度神经网络是一种基于神经网络的机器学习算法，其主要特点是由多层神经元构成，可以根据数据自动调整神经元之间的权重，从而实现对大规模数据进行预

发表于 08-21 17:07 •4342次阅读

人工神经网络模型是一种什么模型

人工神经网络（Artificial Neural Networks，简称ANNs）是一种受生物神经网络启发而产生的数学模型，用于模拟人脑处理信息的方式。它由大量的节点（或称为神经元）相

发表于 07-04 16:57 •1139次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

DeepMind论文推出了一种新的神经网络——GQN

评论

人工神经网络原理及下载

【PYNQ-Z2试用体验】神经网络基础知识

【案例分享】ART神经网络与SOM神经网络

人工神经网络实现方法有哪些？

神经网络结构搜索有什么优势？

如何构建神经网络？

一种基于综合几何特征和概率神经网络的HGU轴轨识别方法

一种基于高效采样算法的时序图神经网络系统介绍

一种基于PID神经网络的解耦控制方法的研究

一种基于人工神经网络的秘密共享方案

一种改进的BP神经网络调制分类器

Google AI子公司开发出一个神经网络GQN，其组成部分介绍

一种新型神经网络结构：胶囊网络

卷积神经网络和深度神经网络的优缺点卷积神经网络和深度神经网络的区别

人工神经网络模型是一种什么模型