0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开辟新篇章!谷歌机器学习又有新进展!

DR2b_Aiobservat 来源:YXQ 2019-06-22 11:16 次阅读

在谷歌最新的论文中,研究人员提出了“非政策强化学习”算法OPC,它是强化学习的一种变体,它能够评估哪种机器学习模型将产生最好的结果。数据显示,OPC比基线机器学习算法有着显著的提高,更加稳健可靠。

在谷歌AI研究团队一篇新发表的论文《通过非政策分类进行非政策评估》(Off-PolicyEvaluation via Off-Policy Classification)和博客文章中,他们提出了所称的“非政策分类”,即OPC(off-policy classification)。它能够评估AI的表现,通过将评估视为一个分类问题来驱动代理性能。

研究人员认为他们的方法是强化学习的一种变体,它利用奖励来推动软件政策实现与图像输入协同工作这个目标,并扩展到包括基于视觉的机器人抓取在内的任务。

“完全脱离政策强化学习是一种变体。代理完全从旧数据中学习,对于工程师来说这是很有吸引力的,因为它可以在不需要物理机器人的情况下进行模型迭代。”

Robotics at Google(专注机器学的的谷歌新团队)的软件工程师Alexa Irpan写道,“完全脱离政策的RL,可以在先前代理收集的同一固定数据集上训练多个模型,然后选择出最佳的那个模型。”

但是OPC并不像听起来那么容易,正如Irpan在论文中所描述的,非政策性强化学习可以通过机器人进行人工智能模型培训,但不能进行评估。并且在需要评估大量模型的方法中,地面实况评估通常效率太低。

OPC在假设任务状态变化方面几乎没有随机性,同时假设代理在实验结束时用“成功或失败”来解决这个问题。两个假设中第二个假设的二元性质,允许为每个操作分配两个分类标签(“有效”表示成功或“灾难性”表示失败)。

另外,OPC还依赖Q函数(通过Q学习算法学习)来估计行为的未来总回报。代理商选择具有最大预期回报的行动,其绩效通过所选行动的有效频率来衡量(这取决于Q函数如何正确地将行动分类为有效与灾难性),并以分类准确性作为非政策评估分数。

(左图为基线,右图为建议的方法之一,SoftOpC)

谷歌AI团队使用完全非策略强化学习对机器学习策略进行了模拟培训,然后使用从以前的实际数据中列出的非策略分数对其进行评估。

在机器人抓取任务时,他们报告OPC的一种变体SoftOPC在预测最终成功率方面表现最佳。假设有15种模型(其中7种纯粹在模拟中训练)具有不同的稳健性,SoftOPC产生的分数与与真正的抓取成功密切相关,并且相比于基线方法更加稳定可靠。

在未来的研究中,研究人员打算用“噪声”(noisier)和非二进制动力学来探索机器学习任务。“我们认为这个结果有希望应用于许多现实世界的RL问题,”Irpan在论文结尾写道。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6168

    浏览量

    105392
  • 机器学习
    +关注

    关注

    66

    文章

    8418

    浏览量

    132646
收藏 人收藏

    评论

    相关推荐

    比亚迪与华工科技开启战略合作新篇章

    近日,比亚迪半导体事业部与华工科技高理公司、激光公司开展座谈交流,开启战略合作新篇章
    的头像 发表于 12-10 14:45 219次阅读

    魏德米勒开启产业数智转型新篇章

    随着制造业向高端、智能、绿色方向不断迈进,以科技创新提质增效,贴近客户挖掘深度需求,成为助力产业发展的重要锚点。11月,工业联接专家魏德米勒的脚步加“数”出发 ,与客户及合作伙伴共同开启产业数智转型新篇章
    的头像 发表于 11-22 15:00 254次阅读

    IOT物联网中台:开启智慧生活新篇章 物联网平台系统

    IOT物联网中台:开启智慧生活新篇章 物联网平台系统
    的头像 发表于 11-19 09:14 264次阅读

    扬帆出海!稳石氢能AEM电解槽出货智利,开启全球商业化新篇章

    继国内商业化获得突破之后,此次海外订单的交付,标志着稳石氢能正式开启了AEM制氢设备全球商业化的新篇章
    的头像 发表于 11-01 10:31 241次阅读
    扬帆出海!稳石氢能AEM电解槽出货智利,开启全球商业化<b class='flag-5'>新篇章</b>!

    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”新篇章

    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”新篇章
    的头像 发表于 10-14 15:36 310次阅读
    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”<b class='flag-5'>新篇章</b>

    摩尔线程与中国移动携手,共筑生态与应用开创数智新篇章

    时代的新篇章。   摩尔线程,作为中国移动投资的国产全功能GPU企业,同时也是中国移动的重要生态伙伴,在本次大会上展示了其全栈AI产品及解决方案,并在中国移动股权投资展位精彩亮相。此外,摩尔线程还积极参与了多个论坛活动,展示了与中国移动在多维度合作中的创新成果与最新进展
    的头像 发表于 10-14 15:36 614次阅读

    复合机器人:开启智能仓储新篇章

    随着工业4.0时代的到来,智能制造和智能仓储已经成为企业发展的重要驱动力。近日,一种全新的复合机器人仓库搬运方案亮相,该方案以复合机器人AMR为核心,通过与搬运机器人AGV的紧密配合,开启了智能仓储的
    的头像 发表于 10-12 16:58 270次阅读
    复合<b class='flag-5'>机器</b>人:开启智能仓储<b class='flag-5'>新篇章</b>

    探索未来智能制造新篇章——富唯智能复合机器

    在科技飞速发展的今天,智能制造已成为推动产业升级的重要引擎。富唯智能凭借其在AI和机器人技术领域的深厚积累,推出了革命性的富唯智能复合机器人,开启了智能制造的新篇章
    的头像 发表于 06-20 17:35 431次阅读
    探索未来智能制造<b class='flag-5'>新篇章</b>——富唯智能复合<b class='flag-5'>机器</b>人

    高校嵌入式教学实验箱,开启智慧教学新篇章

    高校嵌入式教学实验箱,开启智慧教学新篇章
    的头像 发表于 05-23 08:32 517次阅读
    高校嵌入式教学实验箱,开启智慧教学<b class='flag-5'>新篇章</b>

    深开鸿与哈工大重庆研究院合作共同开启智能机器人与协同技术的新篇章

    近日,深开鸿与哈尔滨工业大学重庆研究院(以下简称“哈工大重庆研究院”)正式举行合作启动仪式,共同开启智能机器人与协同技术的新篇章
    的头像 发表于 05-13 09:43 727次阅读
    深开鸿与哈工大重庆研究院合作共同开启智能<b class='flag-5'>机器</b>人与协同技术的<b class='flag-5'>新篇章</b>

    深开鸿与哈工大重庆研究院携手打造智能机器人与协同技术新篇章

    近日,深开鸿与哈尔滨工业大学重庆研究院(以下简称“哈工大重庆研究院”)正式举行合作启动仪式,共同开启智能机器人与协同技术的新篇章。双方将围绕“智能机器人与协同技术”展开深度合作,致力于智能机器
    的头像 发表于 05-12 08:32 530次阅读
    深开鸿与哈工大重庆研究院携手打造智能<b class='flag-5'>机器</b>人与协同技术<b class='flag-5'>新篇章</b>

    华盛昌与易达云成功签署战略协议,共同开启合作新篇章

    2024年5月7日下午,华盛昌与易达云建供应链科技(西安)有限公司成功签署战略合作协议,共同开启全方面战略合作新篇章
    的头像 发表于 05-11 17:43 518次阅读
    华盛昌与易达云成功签署战略协议,共同开启合作<b class='flag-5'>新篇章</b>

    首个鸿蒙生态创新中心在深揭幕,开启鸿蒙产业新篇章共绘鸿蒙原生应用开发新篇章

    首个鸿蒙生态创新中心在深揭幕 开启鸿蒙产业新篇章 2024年3月19日,鸿蒙生态创新中心揭幕仪式在深圳举行,标志着鸿蒙产业发展迈出新的坚实步伐。深圳市人民政府副秘书长黄强,华为终端BG首席运营官何刚
    发表于 03-20 09:55

    两家企业有关LED项目的最新进展

    近日,乾富半导体与英创力两家企业有关LED项目传来最新进展
    的头像 发表于 01-15 13:37 689次阅读

    优必选开创人形机器人产业的新篇章

    优必选科技,这家在人形机器人研发与制造领域享有盛誉的中国企业,于2023年12月29日正式在香港联合交易所挂牌上市。这一里程碑式的成就,不仅彰显了其卓越的研发实力和市场口碑,而且成功开创了人形机器人产业的新篇章,缔造出人形
    的头像 发表于 01-03 18:17 1164次阅读