0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌和亚马逊怎么让AI自己学习

汽车玩家 来源:OFweek人工智能网 作者:将门创投 2020-04-16 14:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能的学习总是需要大量数据的“喂养”。可是这数据要喂多少才是个头呢?有没有什么办法能在少喂数据的同时,不影响AI的学习能力呢?或者直接把一些学习法则交给AI,让它们举一反三?谷歌和亚马逊的研究人员近来就在琢磨这件事。

谷歌AI:背着有限的数据去探索新环境

来自卡耐基梅隆大学、谷歌和斯坦福大学的研究人员近日在一篇论文中写道,他们开发出了一种“弱监督”的人工智能训练框架。该模型会给机器人大量有限的、不精确的、或者是有噪声的数据,让它们通过数据学习,更好地探索一些极具挑战性的环境。值得一提的是,研究人员“喂”给机器人的数据其实并不“完整”,机器人所得到的只是与它们所处的周围环境直接相关的数据。然而出人意料的是,这套相对较少的数据反而提升了机器人操作任务的训练效率。

这个名叫“弱监督控制”(Weakly-Supervised Control,后文简称为WSC)的框架可以对语料库进行学习;在学习过程中,智能代理(intelligent agents)可以生成自己的目标并执行探索任务。

从形式上看,该框架整合了“强化学习机制”(一种通过奖励来激励完成目标的训练形式)。但不同的是,传统的强化学习需要研究人员手动设计奖励,智能代理获取奖励的计算成本很高;与之相比,WSC构建的这种弱监督学习机制是一种能随着智能代理数据收集的进度而自行伸缩扩展的监督方式。换句话说,该模型给代理们提出的奖励目标是基于它们的学习能力和进度的。这样不仅有利于智能代理的学习,对于研究人员来说,他们也不必在智能代理的强化学习循环中不断增加新标签了。

译者注:在人工智能领域,智能代理/智能主体指的是一个能够观察周遭环境并为实现具体目标而付出一系列行动的自主实体。它通常是以软件程序的形式出现的。

在实验中,研究人员试图确定弱监督机制对学习一个解缠表现(disentangled state representation)是否足够必要。他们给几个模型布置了不同复杂度、基于视觉、以目标为条件的模拟操作任务。在一个环境中,智能代理的任务是将特定的对象移动到目标位置;而在另一个环境中,代理必须打开一扇门,并让门开的角度符合任务要求。

论文作者表示,WSC比此前最先进的目标导向式强化学习机制的学习速度还要快。特别是当研究人员不断提升智能代理所处环境复杂性的时候,这种学习速度上的优势表现的格外明显。另外,研究人员还指出,对比智能代理的预设目标和其达成目标后的最终形态,WSC的智能代理呈现出了更高的一致性。这表明,代理们通过该机制学到的是可释性更强的目标达成策略。

不过研究人员也承认,WSC并非没有局限性。它需要使用者给智能代理们标出各种与下游任务直接相关的各种要素,这就对使用者的专业知识提出了较高要求。此外,专家们还指出,他们目前的实验都是在预训练阶段完成的,这个阶段生成的内容其实并不一定来自代理们与机制中的新要素所产生的互动结果。基于此,他们下一步的工作就是要细致研究弱监督机制的其他形式,看看它们能否给智能代理们提供新的有益信息。

“目前在实验中的复杂环境里,WSC已经呈现出了令人欣喜的成果。我们有理由相信,未来若能给真实环境下的机器人也应用这种机制,效果会更为喜人。”论文的合著者们写道,“简言之,我们相信,这个新框架提供了一个监督通用目标学习机制在复杂环境下进行应用实践的新视角。”

亚马逊AI:用元学习机制来学会“举一反三”

从上面的技术原理来看,谷歌的专家们有点像商人,他们的经营思路是要在降低成本的同时,不影响产品(也就是AI的学习能力)的质量和性能。与之相比,亚马逊的研究人员更像是个老师,他们致力于“授人以渔”,让AI学会举一反三的能力。

在即将到来的ICLR上,亚马逊的研究人员将提交一份关于元学习任务(meta-learning tasks)如何大幅提升AI学习能力的论文。

所谓元学习任务,即是一种能让AI在完成相关目标的同时,还能引导其学会如何更好的进行学习的任务模式。亚马逊的研究者声称,他们研发的这种任务模式资源消耗很小:只需少数几个标签训练模板就能让AI“举一反三”,完成好一个个新任务。

在传统的机器学习过程中,模型先是吸纳一系列标记数据(支持集,support set),学习如何把标记数据与特征标签(labels)关联起来;而后,研究人员再喂给模型一些测试数据(测试集,query set),看看它能否根据此前学到的特征标签来厘清这些新数据。

与此种方式相反,在元学习机制下,AI模型要同时运用自身训练数据和研究人员给出的测试数据集来完成任务。在此过程中,模型还可以对两套数据进行比对。这样一来,AI在完成任务的同时,也能看得到自身对训练数据的反应是如何影响其在测试数据上的表现的。

而在第二阶段,也就是所谓的元测试阶段(meta testing),模型要完成的测试任务与自己此前做的元学习任务有明显的关联,却又并不完全相同。和之前的方法相似,在执行每个新任务的过程中,模型还是能同时看到训练数据与测试数据,但这一次,特征标签都是未知的,AI必须通过此前的学习与自己得到的数据来进行判断,正确找出数据与标签的关联性。

在元训练过程中,研究人员所采用的技术并不需要学习一个完整的全局模型。他们的做法是训练一个辅助模型,再通过它为每一个任务生成本地模型,并同时确定其所对应的支持集。

在完成上述工作后,他们又准备了一个辅助网络,目的是充分利用测试集里的未标记数据。这样到了元测试阶段,研究人员就可以用测试集来对前文提到的本地模型进行微调了。

按照该团队的说法,他们的系统通过一次任务学习就达到了16基线(baselines)。更具体的说,其所应用的新机制提高了AI从一个标记的示例出发,去学习一个新对象分类任务的性能。根据底层AI模型体系结构的不同,这种提升幅度在11%和16%之间。

关于这项技术,Alexa Shopping 应用科学家巴勃罗·加西亚(Pablo Garcia)还在一篇博客中进行了介绍:

“过去10年,深度学习系统已经在很多人工智能任务中取得了非同凡响的巨大成功。但在具体应用层面,其发挥空间一直比较有限。元学习机制有望让机器学习系统训练成‘多面手’……该机制的主体思路是让系统能通过少量标签训练示例就能完成一个个新任务。很明显,如果进展顺利,元学习将大幅缩减劳动密集型数据注释工作的需求。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6260

    浏览量

    112045
  • AI
    AI
    +关注

    关注

    91

    文章

    41479

    浏览量

    302803
  • 亚马逊
    +关注

    关注

    8

    文章

    2739

    浏览量

    85899
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    易点天下选择亚马逊云科技 以Agentic AI驱动营销智能化升级

    北京——2026年 4 月 9 日 行业领先的企业国际化智能营销服务商易点天下选择亚马逊云科技,应用亚马逊云科技创新的Agent平台Amazon Bedrock AgentCore、亚马逊云科技主导
    的头像 发表于 04-09 16:15 414次阅读

    谷歌自己发电,AI 系统会回到基础工程吗?

    2026年,谷歌开始自己发电。这不是能源布局,这是系统焦虑。当全球算力顶端的公司,把注意力转向电力,意味着一个信号——AI的瓶颈,正在下沉。 不再只是芯片,不再只是参数。而是系统能否在现实世界里
    的头像 发表于 02-12 15:59 2549次阅读
    当<b class='flag-5'>谷歌</b><b class='flag-5'>自己</b>发电,<b class='flag-5'>AI</b> 系统会回到基础工程吗?

    强化学习自动驾驶模型学习更快吗?

    是一种机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,模型去模仿;而强化学习不会把每一步的“正确答案”都告诉
    的头像 发表于 01-31 09:34 876次阅读
    强化<b class='flag-5'>学习</b>会<b class='flag-5'>让</b>自动驾驶模型<b class='flag-5'>学习</b>更快吗?

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    亚马逊云科技推出全新的Amazon AI Factories 将客户现有基础设施转化为高性能AI环境

    亚马逊云科技在2025 re:Invent全球大会上,宣布推出全新的Amazon AI Factories,助力企业将现有基础设施转化为高性能的AI环境。
    的头像 发表于 12-13 13:44 893次阅读

    亚马逊发布新一代AI芯片Trainium3,性能提升4倍

    电子发烧友网报道(文/李弯弯)在拉斯维加斯举办的2025年亚马逊云科技re:Invent全球大会上,亚马逊云科技(AWS)推出新一代人工智能(AI)训练芯片Trainium 3,预告了下一代产品
    的头像 发表于 12-09 08:37 8944次阅读
    <b class='flag-5'>亚马逊</b>发布新一代<b class='flag-5'>AI</b>芯片Trainium3,性能提升4倍

    融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件

    *附件:ai study.zip*附件:融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件.pdf 基于开源鸿蒙编写的ai
    发表于 11-12 15:38

    AI眼镜或成为下一代手机?谷歌、苹果等巨头扎堆布局

    近年来,AI智能眼镜赛道迎来爆发式增长。谷歌、苹果、Meta、亚马逊等科技巨头纷纷加快布局,将AI眼镜视为下一代人机交互的关键入口。从消费级产品到行业专用设备,多样化的
    的头像 发表于 11-05 17:44 986次阅读

    华曦达亮相谷歌AI亚洲峰会,AI Home业务高增长引领发展新征程

    AI亚洲峰会现场 华曦达基于谷歌云技术底座打造的AIHome解决方案及其自主研发的HomeAIAgent——Cedar成为关注焦点。该系统通过AI驱动的学习与自适应,实时理解并预测用户
    的头像 发表于 09-10 10:22 686次阅读

    亚马逊云科技AI联赛:在全新终极AI对决中学习、创新和竞争

    自2018年以来,AWS DeepRacer 已吸引全球超过56万名开发者参与,充分印证了开发者可以通过竞技实现能力成长的实践路径。如今,亚马逊云科技将通过亚马逊云科技 AI 联赛,将这一模式继续拓展至生成式
    的头像 发表于 08-05 18:03 902次阅读

    The Ocean Cleanup携手亚马逊云科技 利用AI技术加速清除海洋塑料

    The Ocean Cleanup (“海洋清理”)展开合作,充分利用亚马逊云科技在人工智能(AI)、机器学习(ML)及云计算的能力,助力其清理大太平洋垃圾带(Great Pacific Garbage
    的头像 发表于 07-24 14:07 1199次阅读

    今日看点丨亚马逊上海AI研究院解散;索尼拟出售以色列芯片部门

    )正式解散。   王敏捷指出,值得骄傲的是,我们从零孵化出全球知名的图神经网络开源框架DGL,为亚马逊电商创造了近10亿美元的营收;仅实验室规模的团队,拿下机器学习与系统领域顶会全满贯,发表100余篇顶会论文。转向AI Agen
    发表于 07-24 09:42 1469次阅读
    今日看点丨<b class='flag-5'>亚马逊</b>上海<b class='flag-5'>AI</b>研究院解散;索尼拟出售以色列芯片部门

    亚马逊云科技在2025纽约峰会发布多项AI agent创新

    重磅发布Amazon Bedrock AgentCore,亚马逊云科技Marketplace上新并追加1亿美金投资以加速agentic AI发展 Amazon Bedrock AgentCore通过
    的头像 发表于 07-17 16:06 987次阅读
    <b class='flag-5'>亚马逊</b>云科技在2025纽约峰会发布多项<b class='flag-5'>AI</b> agent创新

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    视觉开发板开箱即用的离线AI能力,分类列出学习课程知识点和实操参考,希望能够帮助大家快速掌握离线 AI 智能硬件的基础知识与实战技能,同时了解相关AI技术在实际场景的应用情况。正文按入
    发表于 07-04 11:14

    Agentic AI再竖里程碑,这次引爆革命的还是亚马逊云科技

    科技云报到原创。 谁都知道AI发展的速度日新月异,但当里程碑即将出现时,所有人依然心潮澎湃。 在亚马逊云科技中国峰会上,Agentic AI就是这颗耀眼的科技新星。亚马逊全球副总裁、
    的头像 发表于 06-25 10:28 700次阅读
    Agentic <b class='flag-5'>AI</b>再竖里程碑,这次引爆革命的还是<b class='flag-5'>亚马逊</b>云科技