Facebook的AI通过看视频自学成才-电子发烧友网

人类每天都在进行高层次的规划来指导自己的各种活动，但对于机器人来说这并不容易。幸运的是，越来越多的工作表明，层级抽象（即视觉运动子程序）可以提高强化学习中的样本效率，这是一种人工智能训练技术，它利用奖励来推动智能体实现目标。

传统上，这些层次结构必须通过端到端训练进行手动编程或者获取，这需要大量的时间、持续的注意力和足够的耐心。但是在 Arxiv.org 上新发布的论文「通过观看视频学习导航子程序」中，FacebookAI Research、加州大学伯克利分校和伊利诺伊大学厄巴纳 - 香槟分校的科学家描述了一个通过使用逆机器学习模型摄取视频“伪标记”来学习层次结构。

这让人想起去年 Facebook 开源的一对模型Talk the Walk。该模型可以使用 360 度图像、自然语言以及具有标志性地标（如银行、餐厅等）的地图来指导纽约市的街道，能够在不知道用户位置的情况下提供步行路线。

早上来杯咖啡成为很多都市白领每天必不可少的“自我唤醒”环节。坐在办公室的人类如果想去茶水间倒杯咖啡，你会从门厅走到底，拐向左边的走廊，然后再进入右边的房间。当人类在做这一系列思考与动作的时候，我们不是决定具体需要调动哪块肌肉，而是通过组合这些可重复使用的低级视觉运动子程序来达到目标，从而达成更高抽象水平的规划。

研究人员表示，这些视觉运动子程序，使规划能够减轻传统规划中的高计算成本和强化学习中的高样本复杂性等已知问题。

Facebook的系统包含两个阶段。第一阶段，研究人员通过运行训练模型，使用随机勘探数据的自我监督来生成伪标签。模型学习了分布在四个不同环境中的1500个位置点，然后随机执行30个步骤的动作，产生45,000个交互样本。

在第二阶段，大约217,000个伪标记视频被切成220万个互相独立的剪辑片段然后被输入一个模型，这个模型预测参考视频中采取的相应动作的模型，而一个单独的网络检查参考视频中的动作序列并将行为编码为矢量（例如数学表示）。另一个模型通过预测来自第一帧的轨迹的推断编码，针对任何给定视频帧选择调用哪些学习子例程。

在一个实验中，机器人被部署在真实的办公环境中。研究表明，学习视频（比如如何最有效的方式前往目标位置）能够让机器人的表现比用纯交互方法学习达到更好的效果，至少能够顾及到以前看不见的环境。

也许最令人印象深刻的是，这个训练有素的模型学会了有利于前进导航并避免障碍物，导航任务比曾经的最佳基准快4倍，这使得它能够完全自主地进行长距离行进。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30919

浏览量
269172
Facebook

Facebook

+关注

关注
3

文章
1429

浏览量
54771

原文标题：如何在办公室不动声色地绕过老板视线？Facebook的AI通过看视频自学成才

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

Luma AI Ray 2视频模型即将发布

近日，在2024年亚马逊云科技re:Invent全球大会上，Luma AI宣布了一个令人振奋的消息：其最新版Luma AI Ray 2视频模型即将面向广大消费者、专业人士及开发者开放。这款视频

发表于 12-20 11:37 •227次阅读

OpenAI推出AI视频生成模型Sora

近日，备受期待的OpenAI再次推出了其创新之作——AI视频生成模型Sora。这一新品的发布，无疑为AI技术注入了新的活力。据悉，Sora与OpenAI旗下的AI工具DALL-E有着

发表于 12-12 09:40 •197次阅读

AI视频行为分析系统：重塑安全监控的智能化未来！

分析+报警联动于一体的AI视频行为分析系统。这一系统通过人工智能和深度学习技术，实现了对视频内容的智能分析和识别，相比传统的视频监控系统，为

发表于 11-26 14:51 •373次阅读

可灵AI全球首发视频模型定制功能，助力AI视频创作

近日，快手旗下的可灵AI在全球范围内率先推出了视频模型定制功能，这一创新之举成功解决了AI视频生成过程中人物IP稳定性不足的难题。据了解，用户现在可以在可灵

发表于 11-26 14:02 •513次阅读

Meta发布新AI模型自学评估器，探索减少人类参与度

近日，Facebook母公司Meta正式发布了一批来自其研究部门的新AI模型，其中一款名为「自学评估器」(Self-Taught Evaluator)的模型尤为引人注目。该模型或将成为降低AI

发表于 10-23 13:44 •302次阅读

GENERATION最新研究揭示了中老年员工如何在工作场所体验人工智能

在美国和欧洲，15%的45岁以上员工在工作中使用人工智能，他们大多自学成才且经常使用，体会到了肉眼可见的好处

发表于 10-11 09:11 •256次阅读

ai智能视频监控系统 OpenCV

ai智能视频监控系统选用数字图像处理、计算机视觉和机器视觉技术性，利用软件强劲的数据处理方法工作能力。ai智能视频监控系统是一种集防盗报警系统作用和

发表于 07-08 08:46 •409次阅读

【AIBOX快速入门】2步玩转AI对话

随着目前AI的高速发展，大批量AI硬件应运而生，但使用门槛普遍较高。为了解决这类问题，Firefly开源团队推出了基于Web的AI对话应用：FireflyChat，让AI的使用变得更加

发表于 05-30 08:02 •559次阅读

智谱AI正研发对标Sora的国产文生视频模型

智谱AI，这家国内估值超过200亿的AI大模型独角兽企业，正全力投入研发一款与OpenAI的Sora相媲美的国产文生视频模型。据公司内部人士透露，该模型预计最快将在今年内发布，将成为AI

发表于 05-07 09:22 •534次阅读

迪思与百度智能云联手发布AI视频创作模型

迪思传媒与百度智能云联手研发的AI视频创作模型D&S-AI Video于3月25日正式亮相，并成功集成至迪思AI智链平台。这一创新模型将传统繁琐的视

发表于 03-26 11:46 •714次阅读

新火种AI|围攻光明顶：Sora效应下的AI视频生成竞赛

Sora的出现，让AI视频生成领域真正“活”了起来

发表于 03-16 11:12 •642次阅读

Stability AI与Morph AI共同推出一体化AI视频创作工具

近日，业界领先的AI技术公司Stability AI与中国AI创业公司Morph AI达成重要合作。双方宣布共同推出一款革新性的all-in-one（一体式）

发表于 03-05 10:44 •885次阅读

探索OpenAI Sora视频AI生成技术及其应用如何使用指南

OpenAI的Sora现已扩展其能力范围，进入视频生成领域，标志着人工智能技术在多媒体内容创作上的一个重大突破。Sora的视频AI功能使得用户能够根据文本描述自动生成高质量的视频内容，

发表于 02-20 12:01 •1442次阅读

AI视频年大爆发！2023年AI视频生成领域的现状全盘点

2023年，也是AI视频元年。过去一年究竟有哪些爆款应用诞生，未来视频生成领域面临的难题还有哪些？

发表于 02-20 10:40 •1251次阅读

《新能源车维修技术自学，链接汇总AI智能分类》超4000案例

收藏栏链接共享-新能源车维修自学-超4000案例 -html文件详细见附件 [*附件：收藏栏链接共享-新能源车维修自学-超4000案例.zip] （注：可导入浏览器，在浏览器的收藏栏里方便查看）

发表于 02-18 03:30