开辟新篇章!谷歌机器学习又有新进展!-电子发烧友网

在谷歌最新的论文中，研究人员提出了“非政策强化学习”算法OPC，它是强化学习的一种变体，它能够评估哪种机器学习模型将产生最好的结果。数据显示，OPC比基线机器学习算法有着显著的提高，更加稳健可靠。

在谷歌AI研究团队一篇新发表的论文《通过非政策分类进行非政策评估》（Off-PolicyEvaluation via Off-Policy Classification）和博客文章中，他们提出了所称的“非政策分类”，即OPC（off-policy classification）。它能够评估AI的表现，通过将评估视为一个分类问题来驱动代理性能。

研究人员认为他们的方法是强化学习的一种变体，它利用奖励来推动软件政策实现与图像输入协同工作这个目标，并扩展到包括基于视觉的机器人抓取在内的任务。

“完全脱离政策强化学习是一种变体。代理完全从旧数据中学习，对于工程师来说这是很有吸引力的，因为它可以在不需要物理机器人的情况下进行模型迭代。”

Robotics at Google（专注机器学的的谷歌新团队）的软件工程师Alexa Irpan写道，“完全脱离政策的RL，可以在先前代理收集的同一固定数据集上训练多个模型，然后选择出最佳的那个模型。”

但是OPC并不像听起来那么容易，正如Irpan在论文中所描述的，非政策性强化学习可以通过机器人进行人工智能模型培训，但不能进行评估。并且在需要评估大量模型的方法中，地面实况评估通常效率太低。

OPC在假设任务状态变化方面几乎没有随机性，同时假设代理在实验结束时用“成功或失败”来解决这个问题。两个假设中第二个假设的二元性质，允许为每个操作分配两个分类标签（“有效”表示成功或“灾难性”表示失败）。

另外，OPC还依赖Q函数（通过Q学习算法学习）来估计行为的未来总回报。代理商选择具有最大预期回报的行动，其绩效通过所选行动的有效频率来衡量（这取决于Q函数如何正确地将行动分类为有效与灾难性），并以分类准确性作为非政策评估分数。

（左图为基线，右图为建议的方法之一，SoftOpC）

谷歌AI团队使用完全非策略强化学习对机器学习策略进行了模拟培训，然后使用从以前的实际数据中列出的非策略分数对其进行评估。

在机器人抓取任务时，他们报告OPC的一种变体SoftOPC在预测最终成功率方面表现最佳。假设有15种模型（其中7种纯粹在模拟中训练）具有不同的稳健性，SoftOPC产生的分数与与真正的抓取成功密切相关，并且相比于基线方法更加稳定可靠。

在未来的研究中，研究人员打算用“噪声”（noisier）和非二进制动力学来探索机器学习任务。“我们认为这个结果有希望应用于许多现实世界的RL问题，”Irpan在论文结尾写道。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6207

浏览量
106170
机器学习

机器学习

+关注

关注
66

文章
8453

浏览量
133166

智慧路灯:点亮城市,智慧公交站台开启智慧新篇章

智慧路灯:点亮城市,智慧公交站台开启智慧新篇章

发表于 02-11 13:40 •89次阅读

智慧路灯:点亮城市,智慧公交站台开启智慧<b class='flag-5'>新篇章</b>

比亚迪与华工科技开启战略合作新篇章

近日，比亚迪半导体事业部与华工科技高理公司、激光公司开展座谈交流，开启战略合作新篇章。

发表于 12-10 14:45 •395次阅读

魏德米勒开启产业数智转型新篇章

随着制造业向高端、智能、绿色方向不断迈进，以科技创新提质增效，贴近客户挖掘深度需求，成为助力产业发展的重要锚点。11月，工业联接专家魏德米勒的脚步加“数”出发，与客户及合作伙伴共同开启产业数智转型新篇章。

发表于 11-22 15:00 •334次阅读

IOT物联网中台：开启智慧生活新篇章物联网平台系统

IOT物联网中台：开启智慧生活新篇章 物联网平台系统

发表于 11-19 09:14 •371次阅读

扬帆出海！稳石氢能AEM电解槽出货智利，开启全球商业化新篇章！

继国内商业化获得突破之后，此次海外订单的交付，标志着稳石氢能正式开启了AEM制氢设备全球商业化的新篇章！

发表于 11-01 10:31 •320次阅读

扬帆出海！稳石氢能AEM电解槽出货智利，开启全球商业化<b class='flag-5'>新篇章</b>！

重庆市第五人民医院引领医疗电能质量革命，点亮“健康”新篇章

重庆市第五人民医院引领医疗电能质量革命，点亮“健康”新篇章

发表于 10-14 15:36 •396次阅读

重庆市第五人民医院引领医疗电能质量革命，点亮“健康”<b class='flag-5'>新篇章</b>

摩尔线程与中国移动携手,共筑生态与应用开创数智新篇章

时代的新篇章。　　摩尔线程，作为中国移动投资的国产全功能GPU企业，同时也是中国移动的重要生态伙伴，在本次大会上展示了其全栈AI产品及解决方案，并在中国移动股权投资展位精彩亮相。此外，摩尔线程还积极参与了多个论坛活动，展示了与中国移动在多维度合作中的创新成果与最新进展

发表于 10-14 15:36 •694次阅读

复合机器人：开启智能仓储新篇章

随着工业4.0时代的到来，智能制造和智能仓储已经成为企业发展的重要驱动力。近日，一种全新的复合机器人仓库搬运方案亮相，该方案以复合机器人AMR为核心，通过与搬运机器人AGV的紧密配合，开启了智能仓储的

发表于 10-12 16:58 •353次阅读

阿里巴巴AI赋能海外扩张新篇章

中国电商巨头阿里巴巴集团正积极重启并加速其海外扩张战略，以应对国内电商市场竞争加剧的挑战。此次扩张的一大亮点在于，阿里巴巴将人工智能（AI）技术深度融入其国际业务布局中，开启了海外发展的新篇章。

发表于 07-12 17:56 •1084次阅读

探索未来智能制造新篇章——富唯智能复合机器人

在科技飞速发展的今天，智能制造已成为推动产业升级的重要引擎。富唯智能凭借其在AI和机器人技术领域的深厚积累，推出了革命性的富唯智能复合机器人，开启了智能制造的新篇章。

发表于 06-20 17:35 •486次阅读

高校嵌入式教学实验箱，开启智慧教学新篇章

高校嵌入式教学实验箱，开启智慧教学新篇章

发表于 05-23 08:32 •577次阅读

深开鸿与哈工大重庆研究院合作共同开启智能机器人与协同技术的新篇章

近日，深开鸿与哈尔滨工业大学重庆研究院（以下简称“哈工大重庆研究院”）正式举行合作启动仪式，共同开启智能机器人与协同技术的新篇章。

发表于 05-13 09:43 •823次阅读

深开鸿与哈工大重庆研究院携手打造智能机器人与协同技术新篇章

近日，深开鸿与哈尔滨工业大学重庆研究院（以下简称“哈工大重庆研究院”）正式举行合作启动仪式，共同开启智能机器人与协同技术的新篇章。双方将围绕“智能机器人与协同技术”展开深度合作，致力于智能机器

发表于 05-12 08:32 •614次阅读

华盛昌与易达云成功签署战略协议，共同开启合作新篇章

2024年5月7日下午，华盛昌与易达云建供应链科技（西安）有限公司成功签署战略合作协议，共同开启全方面战略合作新篇章。

发表于 05-11 17:43 •582次阅读

首个鸿蒙生态创新中心在深揭幕，开启鸿蒙产业新篇章共绘鸿蒙原生应用开发新篇章

首个鸿蒙生态创新中心在深揭幕开启鸿蒙产业新篇章 2024年3月19日，鸿蒙生态创新中心揭幕仪式在深圳举行，标志着鸿蒙产业发展迈出新的坚实步伐。深圳市人民政府副秘书长黄强，华为终端BG首席运营官何刚

发表于 03-20 09:55