0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌和亚马逊怎么让AI自己学习

汽车玩家 来源:OFweek人工智能网 作者:将门创投 2020-04-16 14:31 次阅读

人工智能的学习总是需要大量数据的“喂养”。可是这数据要喂多少才是个头呢?有没有什么办法能在少喂数据的同时,不影响AI的学习能力呢?或者直接把一些学习法则交给AI,让它们举一反三?谷歌和亚马逊的研究人员近来就在琢磨这件事。

谷歌AI:背着有限的数据去探索新环境

来自卡耐基梅隆大学、谷歌和斯坦福大学的研究人员近日在一篇论文中写道,他们开发出了一种“弱监督”的人工智能训练框架。该模型会给机器人大量有限的、不精确的、或者是有噪声的数据,让它们通过数据学习,更好地探索一些极具挑战性的环境。值得一提的是,研究人员“喂”给机器人的数据其实并不“完整”,机器人所得到的只是与它们所处的周围环境直接相关的数据。然而出人意料的是,这套相对较少的数据反而提升了机器人操作任务的训练效率。

这个名叫“弱监督控制”(Weakly-Supervised Control,后文简称为WSC)的框架可以对语料库进行学习;在学习过程中,智能代理(intelligent agents)可以生成自己的目标并执行探索任务。

从形式上看,该框架整合了“强化学习机制”(一种通过奖励来激励完成目标的训练形式)。但不同的是,传统的强化学习需要研究人员手动设计奖励,智能代理获取奖励的计算成本很高;与之相比,WSC构建的这种弱监督学习机制是一种能随着智能代理数据收集的进度而自行伸缩扩展的监督方式。换句话说,该模型给代理们提出的奖励目标是基于它们的学习能力和进度的。这样不仅有利于智能代理的学习,对于研究人员来说,他们也不必在智能代理的强化学习循环中不断增加新标签了。

译者注:在人工智能领域,智能代理/智能主体指的是一个能够观察周遭环境并为实现具体目标而付出一系列行动的自主实体。它通常是以软件程序的形式出现的。

在实验中,研究人员试图确定弱监督机制对学习一个解缠表现(disentangled state representation)是否足够必要。他们给几个模型布置了不同复杂度、基于视觉、以目标为条件的模拟操作任务。在一个环境中,智能代理的任务是将特定的对象移动到目标位置;而在另一个环境中,代理必须打开一扇门,并让门开的角度符合任务要求。

论文作者表示,WSC比此前最先进的目标导向式强化学习机制的学习速度还要快。特别是当研究人员不断提升智能代理所处环境复杂性的时候,这种学习速度上的优势表现的格外明显。另外,研究人员还指出,对比智能代理的预设目标和其达成目标后的最终形态,WSC的智能代理呈现出了更高的一致性。这表明,代理们通过该机制学到的是可释性更强的目标达成策略。

不过研究人员也承认,WSC并非没有局限性。它需要使用者给智能代理们标出各种与下游任务直接相关的各种要素,这就对使用者的专业知识提出了较高要求。此外,专家们还指出,他们目前的实验都是在预训练阶段完成的,这个阶段生成的内容其实并不一定来自代理们与机制中的新要素所产生的互动结果。基于此,他们下一步的工作就是要细致研究弱监督机制的其他形式,看看它们能否给智能代理们提供新的有益信息

“目前在实验中的复杂环境里,WSC已经呈现出了令人欣喜的成果。我们有理由相信,未来若能给真实环境下的机器人也应用这种机制,效果会更为喜人。”论文的合著者们写道,“简言之,我们相信,这个新框架提供了一个监督通用目标学习机制在复杂环境下进行应用实践的新视角。”

亚马逊AI:用元学习机制来学会“举一反三”

从上面的技术原理来看,谷歌的专家们有点像商人,他们的经营思路是要在降低成本的同时,不影响产品(也就是AI的学习能力)的质量和性能。与之相比,亚马逊的研究人员更像是个老师,他们致力于“授人以渔”,让AI学会举一反三的能力。

在即将到来的ICLR上,亚马逊的研究人员将提交一份关于元学习任务(meta-learning tasks)如何大幅提升AI学习能力的论文。

所谓元学习任务,即是一种能让AI在完成相关目标的同时,还能引导其学会如何更好的进行学习的任务模式。亚马逊的研究者声称,他们研发的这种任务模式资源消耗很小:只需少数几个标签训练模板就能让AI“举一反三”,完成好一个个新任务。

在传统的机器学习过程中,模型先是吸纳一系列标记数据(支持集,support set),学习如何把标记数据与特征标签(labels)关联起来;而后,研究人员再喂给模型一些测试数据(测试集,query set),看看它能否根据此前学到的特征标签来厘清这些新数据。

与此种方式相反,在元学习机制下,AI模型要同时运用自身训练数据和研究人员给出的测试数据集来完成任务。在此过程中,模型还可以对两套数据进行比对。这样一来,AI在完成任务的同时,也能看得到自身对训练数据的反应是如何影响其在测试数据上的表现的。

而在第二阶段,也就是所谓的元测试阶段(meta testing),模型要完成的测试任务与自己此前做的元学习任务有明显的关联,却又并不完全相同。和之前的方法相似,在执行每个新任务的过程中,模型还是能同时看到训练数据与测试数据,但这一次,特征标签都是未知的,AI必须通过此前的学习与自己得到的数据来进行判断,正确找出数据与标签的关联性。

在元训练过程中,研究人员所采用的技术并不需要学习一个完整的全局模型。他们的做法是训练一个辅助模型,再通过它为每一个任务生成本地模型,并同时确定其所对应的支持集。

在完成上述工作后,他们又准备了一个辅助网络,目的是充分利用测试集里的未标记数据。这样到了元测试阶段,研究人员就可以用测试集来对前文提到的本地模型进行微调了。

按照该团队的说法,他们的系统通过一次任务学习就达到了16基线(baselines)。更具体的说,其所应用的新机制提高了AI从一个标记的示例出发,去学习一个新对象分类任务的性能。根据底层AI模型体系结构的不同,这种提升幅度在11%和16%之间。

关于这项技术,Alexa Shopping 应用科学家巴勃罗·加西亚(Pablo Garcia)还在一篇博客中进行了介绍:

“过去10年,深度学习系统已经在很多人工智能任务中取得了非同凡响的巨大成功。但在具体应用层面,其发挥空间一直比较有限。元学习机制有望让机器学习系统训练成‘多面手’……该机制的主体思路是让系统能通过少量标签训练示例就能完成一个个新任务。很明显,如果进展顺利,元学习将大幅缩减劳动密集型数据注释工作的需求。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6161

    浏览量

    105303
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268887
  • 亚马逊
    +关注

    关注

    8

    文章

    2650

    浏览量

    83319
收藏 人收藏

    评论

    相关推荐

    亚马逊转向Trainium芯片,全力投入AI模型训练

    近日,亚马逊宣布了一项重大决策,决定停止Inferentia AI芯片的开发,转而将全部精力投入到Trainium芯片的研发上,以此作为与英伟达竞争的新策略。 自2018年进军AI芯片领域以来
    的头像 发表于 12-13 14:14 266次阅读

    2024年全球广告销售额破万亿美元,谷歌、Meta和亚马逊占四成

    主要得益于在线广告的强劲推动。其中,Alphabet旗下的谷歌、Meta以及亚马逊等网站在线广告的增长尤为显著。 群邑集团商业智能全球总裁凯特·斯科特·道金斯在周一举行的瑞银全球媒体与传播会议上公布了这一预测结果。她表示,谷歌
    的头像 发表于 12-12 09:43 194次阅读

    如何训练自己AI大模型

    训练自己AI大模型是一个复杂且耗时的过程,涉及多个关键步骤。以下是一个详细的训练流程: 一、明确需求和目标 首先,需要明确自己的需求和目标。不同的任务和应用领域需要不同类型的AI模型
    的头像 发表于 10-23 15:07 1282次阅读

    GE医疗与亚马逊云科技达成战略合作,通过生成式AI加速医疗健康领域转型

    GE医疗已选择亚马逊云科技作为其战略云服务合作伙伴,致力于推出全新的定制化基础模型,加速创新医疗应用快速开发。   GE医疗将利用亚马逊云科技的机器学习和生成式AI技术,训练和部署临床
    发表于 08-29 16:38 270次阅读

    亚马逊云科技推出生成式AI服务Amazon App Studio

    在近期于纽约盛大召开的亚马逊云科技峰会上,一场关于未来应用开发的革命性变革悄然拉开序幕。亚马逊云科技正式推出了其颠覆性产品——Amazon App Studio,一个由前沿生成式AI技术驱动的创新平台,旨在以前所未有的便捷方式,
    的头像 发表于 07-11 17:07 692次阅读

    亚马逊云科技携手SAP通过生成式AI解锁创新潜力

    SAP AI Core的生成式AI中心与Amazon Bedrock的基础模型集成,为企业客户提供生成式AI驱动的洞察,并简化手动流程 西雅图2024年6月7日 /美通社/ -- 亚马逊
    的头像 发表于 06-07 10:53 335次阅读

    亚马逊云携手AI新创企业Hugging Face,提升AI模型在定制芯片计算性能

    Hugging Face作为一家估值为45亿美元的公司现已成为了众多AI研究员和开发者分享Chatbot和相关软件的核心平台,受到亚马逊谷歌、英伟达等巨头的青睐。
    的头像 发表于 05-23 14:24 403次阅读

    荣耀新品将搭载谷歌AI功能,提升生成式AI体验

    荣耀于5月22日宣布,将在新款智能手机上集成谷歌AI功能,实现生成式AI体验。此外,新机还将得到谷歌云服务的支持。
    的头像 发表于 05-23 08:51 481次阅读

    亚马逊、Meta等科技巨头同时投资AI创企Scale AI

    在OpenAI的ChatGPT引领下,人工智能领域掀起新浪潮。谷歌亚马逊、Meta等科技巨头纷纷加大在生成式人工智能和大模型研发上的投入,并积极投资人工智能初创公司。亚马逊对Anthropic的投资高达40亿美元,微软则投资了
    的头像 发表于 05-22 14:33 460次阅读

    谷歌发布多模态AI新品,加剧AI巨头竞争

    在全球AI竞技场上,谷歌与OpenAI一直稳居领先地位。近日,谷歌在I/O开发者大会上掀起了一股新的技术浪潮,发布了多款全新升级的多模态AI产品。
    的头像 发表于 05-16 09:28 446次阅读

    全球云服务市场增长,亚马逊AWS、微软Azure及谷歌GCP差距拉大

    报告指出,目前全球的主要云服务商包括亚马逊AWS(市场份额31%),其次是微软Azure(25%)和谷歌(11%)。尽管亚马逊在整体市场仍占优势,但随着微软和谷歌的快速发展,两者的市场
    的头像 发表于 05-06 11:34 591次阅读

    谷歌推出多模态VLOGGER AI

    谷歌最新推出的VLOGGER AI技术引起了广泛关注,这项创新的多模态模型能够静态肖像图“活”起来并“说话”。用户只需提供一张人物肖像照片和一段音频内容,VLOGGER AI就能让图
    的头像 发表于 03-22 10:45 835次阅读

    亚马逊推出电商AI工具

    亚马逊近日宣布推出了一项创新的电商AI工具,该工具旨在帮助卖家们更加高效地创建产品详情页面。据了解,这一AI新功能具备强大的自动化能力,能够基于卖家提供的关键词和产品图片等信息,智能地生成产品标题、描述以及其他重要的详细信息。
    的头像 发表于 03-21 11:45 778次阅读

    谷歌AI大模型Gemma全球开放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌AI领域的领先地位,还为其在全球范围内的竞争力增添了新
    的头像 发表于 02-28 18:12 1136次阅读

    谷歌DeepMind资深AI研究员创办AI Agent创企

    近日,刚从谷歌DeepMind离职的资深AI研究员Ioannis Antonoglou宣布创办了一家名为“AI Agent”的创企。Ioannis Antonoglou常驻伦敦,此前曾担任谷歌
    的头像 发表于 02-04 10:02 784次阅读