0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用MineDojo构建具有一般能力的人工智能代理

星星科技指导员 来源:NVIDIA 作者:Nathan Horrocks 2022-08-15 17:10 次阅读

使用视频游戏作为训练人工智能的媒介已经成为人工智能研究界的一种流行方法。这些自主代理在 Atari 游戏、星际争霸、 Dota 和 Go 中取得了巨大成功。但是,虽然这些进步在人工智能研究中很受欢迎,但与不断从开放式任务中学习的人类不同,智能体并没有泛化到一组非常特定的任务之外。

构建能够在广泛任务中实现高水平性能的嵌入式代理一直是人工智能研究界面临的最大挑战之一。为了构建一个成功的多面手代理,用户需要一个支持多种任务和目标的环境、一个多模式知识的大规模数据库和一个灵活且可扩展的代理体系结构。

进入 Minecraft ,世界上玩得最多的游戏。凭借其灵活的游戏性,玩家可以做各种各样的动作。从建造中世纪城堡到探索危险环境,再到收集资源建造幽冥之门与幽冥之龙作战。这种创造性的氛围是培养具体化代理的完美环境。

为了利用这样一个最佳的训练场地, NVIDIA 的研究人员创造了 MineDojo 。 MineDojo 构建了一个庞大的框架,其特点是一个模拟套件,包含数千个不同的开放式任务和一个互联网规模的知识库。如果没有一个扩展的数据库,构建一个强大到足以完成这些任务的人工智能是不可能的。

MineDojo 的使命是促进研究,以实现具有普遍能力的嵌入式代理的目标。为了使嵌入式代理成功,环境需要提供几乎无限多的开放式任务和操作。这是通过让代理访问大型信息数据库来获取知识,然后应用所学知识来实现的。从嵌入式代理获得的训练需要具有可扩展性,以便稍后将大规模知识转换为可操作的见解。

在 MineDojo 中,嵌入式代理可以访问三个互联网规模的数据集。随着 750000 个 Minecraft YouTube 视频(总计 33 年多的 Minecraft 视频)被纳入数据库, 200 多万个单词被转录。

MineDojo 还从 Minecraft Wiki 上抓取了 6000 多个网页,为这些网页的视觉元素创建了 220 多万个边界框)。此外,还捕获了数百万条与 Minecraft 相关的 Reddit 线程以及在游戏中可以进行的各种活动。问题包括如何解决某些任务,以图像和视频格式展示成就和创作,以及一般提示和技巧。

MineDojo 提供了一组模拟器 API ,用户可以使用这些 API 来训练他们的人工智能代理。它提供了统一的观察和操作空间,以帮助代理适应新的场景和多任务。此外,使用 API ,用户可以利用 Minecraft 宇宙中的所有三个世界来扩展代理可以执行的任务和操作的数量。

在模拟器中, MIneDojo 将基准测试任务分为两类:编程任务和创造性任务。

编程任务定义明确,易于评估,例如“存活 3 天”或“在森林中获得一单位南瓜”

创造性的任务更具开放性,例如“建造一座美丽的海滩小屋”很难通过一套明确的规则来定义什么是海滩别墅。这些任务是为了鼓励研究界开发更人性化和富有想象力的人工智能代理。

自然语言是 MineDojo 框架的基石。它有助于开放式词汇理解,为图像和视频模式提供基础,并作为指定指令的直观界面。结合 最新语音识别技术 ,在不久的将来,你可以像在多人合作模式下与朋友一样与人工智能代理交谈。

例如:“在我们的房子前面种一排蓝色的花。在门框上加一些金色的装饰。让我们去探索河边的洞穴。”这一切都是可能的。

使用 MineCLIP 进行概念验证

为了帮助推动该项目并提供概念证明, MineDojo 研究人员已经实现了一个单语言提示代理,以完成 Minecraft 中的几个复杂任务,称为 MineCLIP 。这种新颖的代理学习算法利用了 33 年的 Minecraft YouTube 视频。然而,值得一提的是,任何代理都可以根据用户的判断使用互联网规模数据库的任何或全部三个部分。

MineCLIP 作为一个具体的代理,从 YouTube 视频中学习 Minecraft 的概念和动作,而不需要人工标记。 YouTubers 通常会在播放游戏视频时讲述他们在做什么。 MineCLIP 是一个大型 transformer 模型,它学习将视频剪辑与其对应的英语成绩单相关联。

该关联分数可以作为奖励信号提供,以指导强化学习代理完成任务。对于示例任务“剪一只羊以获得羊毛”,如果代理接近羊, MineCLIP 会给代理较高的奖励,但如果代理漫无目的地漫游,则会给较低的奖励。它甚至可以在游戏中进行多任务处理,以完成广泛的简单任务。

构建具有普遍能力的具体化代理是人工智能研究的圣杯目标。 MineDojo 提供了 1000 个任务的基准、互联网规模的丰富知识库和创新算法,作为解决这一重大挑战的第一步。

关于作者

Nathan Horrocks 是 NVIDIA Research 的内容营销经理。他重点强调了 NVIDIA 实验室在世界各地进行的惊人研究。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5064

    文章

    18992

    浏览量

    302588
  • API
    API
    +关注

    关注

    2

    文章

    1481

    浏览量

    61776
  • 模拟器
    +关注

    关注

    2

    文章

    864

    浏览量

    43150
收藏 人收藏

    评论

    相关推荐

    嵌入式和人工智能究竟是什么关系?

    嵌入式和人工智能究竟是什么关系? 嵌入式系统是种特殊的系统,它通常被嵌入到其他设备或机器中,以实现特定功能。嵌入式系统具有非常强的适应性和灵活性,能够根据用户需求进行定制化设计。它广泛应用于各种
    发表于 11-14 16:39

    微软从11月起将允许客户构建自主人工智能代理

    微软宣布了项重大进展,自下个月起,其将开放给客户构建自主人工智能代理能力,此举标志着微软在把握快速增长的AI技术趋势方面迈出了关键步伐,
    的头像 发表于 10-25 16:06 232次阅读

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    阅读这章后,我深感人工智能与生命科学的结合正引领着场前所未有的科学革命,以下是我个人的读后感: 1. 技术革新与生命科学进步 这章详细阐述了
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第人工智能驱动的科学创新学习心得

    的发展机遇。同时,这也要求科研人员、政策制定者和社会各界共同努力,构建个健康、包容的AI科研生态系统。 总之,《AI for Science:人工智能驱动科学创新》的第章为我打开了
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    的兼容性和可靠性,并为其在人工智能图像处理领域的应用提供更有力的保障。 综上所述,RISC-V在人工智能图像处理领域具有广阔的应用前景。其开源性、灵活性、低功耗和高性能等特点使得它成为该领域的重要技术之
    发表于 09-28 11:00

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    ! 《AI for Science:人工智能驱动科学创新》 这本书便将为读者徐徐展开AI for Science的美丽图景,与大家起去了解: 人工智能究竟帮科学家做了什么? 人工智能
    发表于 09-09 13:54

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 、深度学习加速 训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性
    发表于 07-29 17:05

    Python中的人工智能框架与实例

    人工智能(AI)领域,Python因其简洁的语法、丰富的库和强大的社区支持,成为了最受欢迎的编程语言之。本文将详细介绍Python中的人工智能框架,并通过具体实例展示如何使用这些框架来实现不同
    的头像 发表于 07-15 14:54 1546次阅读

    如何使用PyTorch构建更高效的人工智能

    术界和工业界得到了广泛应用。本文将深入探讨如何使用PyTorch构建更高效的人工智能系统,从框架基础、模型训练、实战应用等多个方面进行详细解析。
    的头像 发表于 07-02 13:12 324次阅读

    2024年十大顶尖的人工智能芯片制造供应商

    如下图所示,神经网络的参数数量(即宽度和深度)以及模型大小都在增加。为了构建更好的深度学习模型和强大的人工智能应用程序,组织需要增加计算能力和内存带宽。
    的头像 发表于 05-19 14:27 2872次阅读
    2024年十大顶尖<b class='flag-5'>的人工智能</b>芯片制造供应商

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能
    发表于 02-26 10:17

    用Redis为LangChain定制AI代理——OpenGPTs

    构建定制化的人工智能代理。因为Redis具有高速和稳定性的优点,所以LangChain选择了Redis来作为OpenGPTs的默认向量数据库。文
    的头像 发表于 01-13 08:03 800次阅读
    用Redis为LangChain定制AI<b class='flag-5'>代理</b>——OpenGPTs

    aigc是什么意思和人工智能有什么区别

    AIGC是人工智能通用计算平台(Artificial Intelligence General Computing)的缩写,它是种集成了人工智能技术与通用计算能力的平台。与传统
    的头像 发表于 01-11 09:49 9888次阅读

    身边的人工智能有哪些

    应用,并探讨它们对我们的生活产生的影响。 智能手机中的人工智能 1. 语音助手: 在智能手机中,我们常见的语音助手有Siri、Google Assistant、Amazon Ale
    的头像 发表于 12-07 16:32 3325次阅读