0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开辟新篇章!谷歌机器学习又有新进展!

DR2b_Aiobservat 来源:YXQ 2019-06-22 11:16 次阅读

在谷歌最新的论文中,研究人员提出了“非政策强化学习”算法OPC,它是强化学习的一种变体,它能够评估哪种机器学习模型将产生最好的结果。数据显示,OPC比基线机器学习算法有着显著的提高,更加稳健可靠。

在谷歌AI研究团队一篇新发表的论文《通过非政策分类进行非政策评估》(Off-PolicyEvaluation via Off-Policy Classification)和博客文章中,他们提出了所称的“非政策分类”,即OPC(off-policy classification)。它能够评估AI的表现,通过将评估视为一个分类问题来驱动代理性能。

研究人员认为他们的方法是强化学习的一种变体,它利用奖励来推动软件政策实现与图像输入协同工作这个目标,并扩展到包括基于视觉的机器人抓取在内的任务。

“完全脱离政策强化学习是一种变体。代理完全从旧数据中学习,对于工程师来说这是很有吸引力的,因为它可以在不需要物理机器人的情况下进行模型迭代。”

Robotics at Google(专注机器学的的谷歌新团队)的软件工程师Alexa Irpan写道,“完全脱离政策的RL,可以在先前代理收集的同一固定数据集上训练多个模型,然后选择出最佳的那个模型。”

但是OPC并不像听起来那么容易,正如Irpan在论文中所描述的,非政策性强化学习可以通过机器人进行人工智能模型培训,但不能进行评估。并且在需要评估大量模型的方法中,地面实况评估通常效率太低。

OPC在假设任务状态变化方面几乎没有随机性,同时假设代理在实验结束时用“成功或失败”来解决这个问题。两个假设中第二个假设的二元性质,允许为每个操作分配两个分类标签(“有效”表示成功或“灾难性”表示失败)。

另外,OPC还依赖Q函数(通过Q学习算法学习)来估计行为的未来总回报。代理商选择具有最大预期回报的行动,其绩效通过所选行动的有效频率来衡量(这取决于Q函数如何正确地将行动分类为有效与灾难性),并以分类准确性作为非政策评估分数。

(左图为基线,右图为建议的方法之一,SoftOpC)

谷歌AI团队使用完全非策略强化学习对机器学习策略进行了模拟培训,然后使用从以前的实际数据中列出的非策略分数对其进行评估。

在机器人抓取任务时,他们报告OPC的一种变体SoftOPC在预测最终成功率方面表现最佳。假设有15种模型(其中7种纯粹在模拟中训练)具有不同的稳健性,SoftOPC产生的分数与与真正的抓取成功密切相关,并且相比于基线方法更加稳定可靠。

在未来的研究中,研究人员打算用“噪声”(noisier)和非二进制动力学来探索机器学习任务。“我们认为这个结果有希望应用于许多现实世界的RL问题,”Irpan在论文结尾写道。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6128

    浏览量

    104934
  • 机器学习
    +关注

    关注

    66

    文章

    8347

    浏览量

    132292
收藏 人收藏

    评论

    相关推荐

    扬帆出海!稳石氢能AEM电解槽出货智利,开启全球商业化新篇章

    继国内商业化获得突破之后,此次海外订单的交付,标志着稳石氢能正式开启了AEM制氢设备全球商业化的新篇章
    的头像 发表于 11-01 10:31 109次阅读
    扬帆出海!稳石氢能AEM电解槽出货智利,开启全球商业化<b class='flag-5'>新篇章</b>!

    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”新篇章

    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”新篇章
    的头像 发表于 10-14 15:36 189次阅读
    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”<b class='flag-5'>新篇章</b>

    摩尔线程与中国移动携手,共筑生态与应用开创数智新篇章

    时代的新篇章。   摩尔线程,作为中国移动投资的国产全功能GPU企业,同时也是中国移动的重要生态伙伴,在本次大会上展示了其全栈AI产品及解决方案,并在中国移动股权投资展位精彩亮相。此外,摩尔线程还积极参与了多个论坛活动,展示了与中国移动在多维度合作中的创新成果与最新进展
    的头像 发表于 10-14 15:36 400次阅读

    复合机器人:开启智能仓储新篇章

    随着工业4.0时代的到来,智能制造和智能仓储已经成为企业发展的重要驱动力。近日,一种全新的复合机器人仓库搬运方案亮相,该方案以复合机器人AMR为核心,通过与搬运机器人AGV的紧密配合,开启了智能仓储的
    的头像 发表于 10-12 16:58 197次阅读
    复合<b class='flag-5'>机器</b>人:开启智能仓储<b class='flag-5'>新篇章</b>

    5G新通话技术取得新进展

    在探讨5G新通话这一话题时,我们需首先明确其背景与重要性。自2022年4月国内运营商正式推出以来,5G新通话作为传统语音通话的升级版,迅速吸引了公众的目光,并引起了社会的广泛关注。它基于5G网络,代表了通信技术的新进展
    的头像 发表于 10-12 16:02 494次阅读

    镭拓机器人激光焊接机:智能制造的新篇章

    在智能制造的浪潮中,机器人激光焊接机以其独特的魅力和无限潜力,正引领着一场工业革命的新篇章。这不仅仅是一台机器,更是现代科技与工业艺术的完美结合,它以激光为笔,以金属为纸,绘制出一幅幅精密制造的壮丽
    的头像 发表于 07-24 15:47 480次阅读
    镭拓<b class='flag-5'>机器</b>人激光焊接机:智能制造的<b class='flag-5'>新篇章</b>

    阿里巴巴AI赋能海外扩张新篇章

    中国电商巨头阿里巴巴集团正积极重启并加速其海外扩张战略,以应对国内电商市场竞争加剧的挑战。此次扩张的一大亮点在于,阿里巴巴将人工智能(AI)技术深度融入其国际业务布局中,开启了海外发展的新篇章
    的头像 发表于 07-12 17:56 921次阅读

    探索未来智能制造新篇章——富唯智能复合机器

    在科技飞速发展的今天,智能制造已成为推动产业升级的重要引擎。富唯智能凭借其在AI和机器人技术领域的深厚积累,推出了革命性的富唯智能复合机器人,开启了智能制造的新篇章
    的头像 发表于 06-20 17:35 366次阅读
    探索未来智能制造<b class='flag-5'>新篇章</b>——富唯智能复合<b class='flag-5'>机器</b>人

    高校嵌入式教学实验箱,开启智慧教学新篇章

    高校嵌入式教学实验箱,开启智慧教学新篇章
    的头像 发表于 05-23 08:32 428次阅读
    高校嵌入式教学实验箱,开启智慧教学<b class='flag-5'>新篇章</b>

    深开鸿与哈工大重庆研究院合作共同开启智能机器人与协同技术的新篇章

    近日,深开鸿与哈尔滨工业大学重庆研究院(以下简称“哈工大重庆研究院”)正式举行合作启动仪式,共同开启智能机器人与协同技术的新篇章
    的头像 发表于 05-13 09:43 639次阅读
    深开鸿与哈工大重庆研究院合作共同开启智能<b class='flag-5'>机器</b>人与协同技术的<b class='flag-5'>新篇章</b>

    深开鸿与哈工大重庆研究院携手打造智能机器人与协同技术新篇章

    近日,深开鸿与哈尔滨工业大学重庆研究院(以下简称“哈工大重庆研究院”)正式举行合作启动仪式,共同开启智能机器人与协同技术的新篇章。双方将围绕“智能机器人与协同技术”展开深度合作,致力于智能机器
    的头像 发表于 05-12 08:32 475次阅读
    深开鸿与哈工大重庆研究院携手打造智能<b class='flag-5'>机器</b>人与协同技术<b class='flag-5'>新篇章</b>

    华盛昌与易达云成功签署战略协议,共同开启合作新篇章

    2024年5月7日下午,华盛昌与易达云建供应链科技(西安)有限公司成功签署战略合作协议,共同开启全方面战略合作新篇章
    的头像 发表于 05-11 17:43 443次阅读
    华盛昌与易达云成功签署战略协议,共同开启合作<b class='flag-5'>新篇章</b>

    首个鸿蒙生态创新中心在深揭幕,开启鸿蒙产业新篇章共绘鸿蒙原生应用开发新篇章

    首个鸿蒙生态创新中心在深揭幕 开启鸿蒙产业新篇章 2024年3月19日,鸿蒙生态创新中心揭幕仪式在深圳举行,标志着鸿蒙产业发展迈出新的坚实步伐。深圳市人民政府副秘书长黄强,华为终端BG首席运营官何刚
    发表于 03-20 09:55

    两家企业有关LED项目的最新进展

    近日,乾富半导体与英创力两家企业有关LED项目传来最新进展
    的头像 发表于 01-15 13:37 644次阅读

    优必选开创人形机器人产业的新篇章

    优必选科技,这家在人形机器人研发与制造领域享有盛誉的中国企业,于2023年12月29日正式在香港联合交易所挂牌上市。这一里程碑式的成就,不仅彰显了其卓越的研发实力和市场口碑,而且成功开创了人形机器人产业的新篇章,缔造出人形
    的头像 发表于 01-03 18:17 1093次阅读