0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI的研究人员开发了一套基于能量的神经网络模型

DPVg_AI_era 来源:未知 作者:李倩 2018-11-10 10:34 次阅读

OpenAI的研究人员开发了一套基于能量的神经网络模型,可以快速学会识别并生成关于概念的实例,比如附近、上方、之间、最近、最远等,并将这些概念用2D点集来表示。模型可以仅在5次演示之后就学会这类概念,并实现了跨领域的概念迁移。

衡量是否达到人类智能,涉及由有限的经验,通过抽象推理和规划、类比推理、创造性问题解决和语言能力的概括,从而将经验整合到概念中,将概念作为理解和推理的基本架构。

这款基于能量的新模型,让智能体能够从任务中学习和提取概念,并使用这些概念来解决多个领域中的其他任务。比如可以在2D粒子环境中应用的学习概念,然后在基于3D的机器人环境中执行相同的任务,无需在新环境中重新训练。

通过基于能量的模型训练的模拟机器人,利用不同2D域中学习到的概念,将手臂导航至两点之间

本研究利用能量函数,让智能体学习分类和生成简单的概念,来解决在不同环境中的两点之间导航等任务。这些概念包括视觉概念(“红色”、“正方形”)、空间概念(“内部”、“在...之上”)、时间概念(“慢”、“之后”),社会概念(“积极”、“有用”)等等。

一旦智能体学会了这些概念,就会成为其理解和推理的基本模块,最近DeepMind和 Vicarious的一些其他研究也表明了这一点。

能量函数让系统可以生成(左)并识别(右)基本概念,比如“正方形”的概念。

构建能量函数:基于关系网络体系结构的神经网络

为了创建能量函数,需要在数学上将概念表示为能量模型。

我们根据以下要素来定义每个概念的能量函数 E(x,a,w):

模型观察到的世界状态(x)

该状态下该实体的注意力掩膜(a)。

作为条件的连续值向量(w),用于指定计算能量的概念

世界上的众多状态由多组实体及其属性和位置组成(比如下面的点,就具有位置和颜色属性)。用于“识别”的注意力掩膜表示模型对某些实体集的关注。

能量模型输出单个正数,表示满足相应概念(零能量)或不满足概念(高能量)。当注意力掩模集中在表示概念的一组实体上时,该概念即被满足,这需要实体处于正确的位置(修改x、生成概念),而且注意力掩膜关注的是正确的实体(修改a、识别概念)。

我们将能量函数构建为基于关系网络体系结构的神经网络,允许其将任意数量的实体作为输入。这个能量函数的参数是由我们的训练程序进行优化的,其他函数是从能量函数中隐式导出的。

这样,我们能够使用能量函数来学习可以执行生成和识别的单个网络,并可以交叉使用从生成到识别的学习概念,反之亦然。(目前已经通过镜像神经元在动物身上观察到了这种效应。)

单一网络的训练

训练数据由(注意掩膜、状态)的轨迹组成,提前生成的轨迹用于确认我们希望模型学习的特定概念。我们为给定概念集提供一组演示(通常为5次)来训练模型,然后将模型置于一个新的环境(X0),并要求其预测下一个状态(X1)和下一个注意力掩膜(a)。

优化能量函数,向训练数据中找到的下一个状态和下一个注意力掩模分配低能量值。与变分自动编码器等生成模型类似,激励模型去学习那些对于压缩任务方面的有用值。我们使用各种概念来训练模型,包括视觉,空间,远近和时间关系,以及二维粒子环境中的量化。

空间区域概念:给出2D示例点(左),推断该点上的能量函数(中间),然后使用能量上的随机梯度下降来生成新的点(右)

模型在概念生成和识别训练中分享经验,实现迁移学习

我们在一系列任务中对模型进行了评估,旨在测试单一系统识别和生成相同概念下的目标的能力,我们的系统可以学习分类,可以生成特定的空间关系集,还可以以特定方式通过场景对实体进行导航,或者可以对数量(比如一个、两个、三个或三个以上)或接近度等概念进行比较准确的判断。

数量概念:示例注意力掩膜在一个、两个、三个或三个以上的目标上的表现,可推断用于生成类似数量概念的注意力掩模

模型在学习概念的生成(通过在状态向量x中移动目标实现)和识别(通过在固定状态向量上更改注意力掩膜实现)之间分享经验时的表现更好:在我们对共同执行这两类任务的模型进行评估时发现,它们的表现都比仅在各自执行单一任务训练的模型更好。

此外,我们还发现了迁移学习的迹象。只在概念识别环境中训练过的能量函数,也能很好地执行概念生成任务,即使其没有经过明确的训练。

未来方向:进一步探索概念和语言理解的关系

我们很高兴能够在更丰富的三维环境中学到的更广泛的概念,将概念与智能体决策策略相结合(因为到目前为止,我们只是将概念视为从被动体验中学到的东西),并探索概念和语言理解之间的联系。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28191

    浏览量

    206505
  • 神经网络
    +关注

    关注

    42

    文章

    4762

    浏览量

    100535
  • 智能体
    +关注

    关注

    1

    文章

    131

    浏览量

    10567

原文标题:OpenAI概念学习新模型:学会概念仅需5次示范,实现跨领域概念迁移

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    神经网络教程(李亚非)

      第1章 概述  1.1 人工神经网络研究与发展  1.2 生物神经元  1.3 人工神经网络的构成  第2章人工神经网络基本
    发表于 03-20 11:32

    如何构建神经网络

    原文链接:http://tecdat.cn/?p=5725 神经网络种基于现有数据创建预测的计算系统。如何构建神经网络神经网络包括:输入层:根据现有数据获取输入的层隐藏层:使用反
    发表于 07-12 08:02

    隐藏技术: 种基于前沿神经网络理论的新型人工智能处理器

    隐藏技术: 种基于前沿神经网络理论的新型人工智能处理器 Copy东京理工大学的研究人员开发了种名为“ Hiddenite”的新型加速器芯
    发表于 03-17 19:15

    卷积神经网络模型发展及应用

    network,DBN)[24], 从此拉开了深度学习大幕。随着深度学习理论的研究和发展,研究人员提 出了系列卷积神经网络模型。为了比较
    发表于 08-02 10:39

    OpenAI发布工具库 可在GPU上建立更快、更高效、占内存更少的神经网络

    OpenAI研究人员日前发布了个工具库,该工具库可以帮助研究人员在图形处理器(graphics-processor-unit,GPU)上建立更快、更高效、占内存更少的
    的头像 发表于 01-27 00:34 4018次阅读
    <b class='flag-5'>OpenAI</b>发布工具库 可在GPU上建立更快、更高效、占内存更少的<b class='flag-5'>神经网络</b>

    深度神经决策树:深度神经网络和树模型结合的新模型

    近日,来自爱丁堡大学的研究人员提出了种结合深度神经网络和树模型的新型模型——深度神经决策树(D
    的头像 发表于 08-19 09:14 1.2w次阅读

    研究人员开发解释多义词的神经网络

    艾伦人工智能研究所和华盛顿大学的研究人员正在使用可以根据上下文来确定英文单词含义的神经网络
    的头像 发表于 09-12 15:52 2190次阅读

    研究人员开发了种新颖的机器学习管道

    研究人员通过种特殊的神经网络模型,它以“基本块”(计算指令的基本摘要)形式训练标记的数据,以自动预测其持续时间使用给定的芯片执行以前看不见的基本块。结果表明,这种
    的头像 发表于 04-15 16:42 1821次阅读

    基于内存的人工智能神经网络架构

    在过去十年左右的时间里,研究人员已经开发了多种基于人工神经网络(ANN)的计算模型。尽管已发现许多这些模型在特定任务上表现良好,但它们并不总
    的头像 发表于 12-18 13:40 1607次阅读

    研究人员开发“液态”神经网络 可适应快速变化的训练环境

    设计出了种具有重大改进的“液态”神经网络。其特点是能够在投入训练阶段之后,极大地扩展 AI 技术的灵活性。 通常情况下,研究人员会在训练阶段向神经网络算法提供大量相关的目标数据,来磨
    的头像 发表于 01-29 10:46 1523次阅读

    OpenAI研究人员开发出新的机械臂

    近日,两个由 OpenAI研究人员开发一模一样的机械臂爱丽丝和鲍勃,可以在模拟情景中通过对弈互相学习,而不需要人为输入文本。
    的头像 发表于 02-23 10:40 1879次阅读

    cnn卷积神经网络模型 卷积神经网络预测模型 生成卷积神经网络模型

    cnn卷积神经网络模型 卷积神经网络预测模型 生成卷积神经网络模型  卷积
    的头像 发表于 08-21 17:11 1202次阅读

    卷积神经网络模型搭建

    卷积神经网络模型搭建 卷积神经网络模型种深度学习算法。它已经成为了计算机视觉和自然语言处理等各种领域的主流算法,具有很大的应用前景。本篇
    的头像 发表于 08-21 17:11 928次阅读

    PyTorch神经网络模型构建过程

    PyTorch,作为个广泛使用的开源深度学习库,提供了丰富的工具和模块,帮助开发者构建、训练和部署神经网络模型。在神经网络
    的头像 发表于 07-10 14:57 449次阅读

    pytorch中有神经网络模型

    处理、语音识别等领域取得了显著的成果。PyTorch是个开源的深度学习框架,由Facebook的AI研究团队开发。它以其易用性、灵活性和高效性而受到广泛欢迎。在PyTorch中,有许多预训练的
    的头像 发表于 07-11 09:59 637次阅读