0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌提出了一种称为时间循环一致性学习的自监督方法

nlfO_thejiangme 来源:lq 2019-10-01 16:43 次阅读

视频理解是计算机视觉中的重要任务,近年来随着深度学习特别是监督学习的应用视频理解取得了飞速的发展,例如视频行为分类和视频片段总结等任务都取得了令人瞩目的成果。

不过,现实生活中很多场景的应用视频片段需要不止一个标签来提供足够的信息。举个例子,机器人往杯子里倒水,一个简单的“倾倒液体”标签不足以预测出杯子何时倒满,机器人需要逐帧追踪杯中的水量。再比如说,在运动分析领域,棒球教练不仅仅想要看到投球的动作,而是想精确地分析投手投出棒球离手的一瞬间,单一的视频标签不足以完成这样的视频检索任务。这意味着视频理解模型需要逐帧理解视频的能力。

然而如果使用监督学习的方法将会使学习成本变得非常昂贵,这需要针对视频里每一帧的动作进行细粒度的标注,训练不同的动作还需要新的标注来提供监督信号。但从机器人到运动分析等领域,细粒度的视频理解有着很强的需求,那么如何在不需要大量标签的情况下对视频进行学习以理解细粒度的信息呢?

来自谷歌的研究人员们提出了一种称为时间循环一致性学习(Temporal Cycle-Consistency Learning,TCC)的自监督方法。通过学习不同样本相似过程的表示来实现细粒度的时域视频理解,为逐帧视频检索、动作分析、视频同步和多模态迁移提供了新的解决方案。

基于TCC的视频表示学习

世间的万事万物发展的过程都有特定的规律,从嫩芽到参天大树的植物生长到起床上班回家两点一线的996工作,再到简单倒水的动作都在时间上满足一定的顺序。

多个不同实例的相同过程可以从视频捕捉到的信息中找到对应的联系。全世界的人往容器中倒水动作都差不多,无论对象是茶壶、酒瓶、水壶都有着相似的过程。其中倾倒液体的关键时刻在多个不同的视频中都有着相同的特性——都需要举起起一个容器向另一个容器中倾倒,而视频中的其他特性则与拍摄的视角、光照、环境、尺度、容器以及速度有关。TCC的关键在于通过循环一致性的原则,从多个视频中寻找出对应的相同动作。

算法的目标在于训练出一个有效的帧编码器来获取对应动作的表示编码。研究人员首先将两个待配准的视频传入编码器中获取对应的嵌入信息,而后选择两个视频来进行TCC的训练,其中video1作为参考视频,从中取出一帧并利用最邻近方法在嵌入空间中找到video2中最为近似的一帧;而后以video2中找到的这一帧作为输入,从新到嵌入空间中寻找video中对应的帧(circle过程)。如果学习出的嵌入空间具有循环一致性的话,这一帧和先前输入video1的参考帧应该是同一帧。

上图中可以看到,左边的嵌入在循环检索后对应原来的帧,说明循环一致性得到满足;而右边的嵌入在循环检索后获取的帧与输入的帧有差异,则表示这一嵌入的循环一致性没有得到满足,他们在嵌入空间中的差值就表示为循环一致性损失。模型的训练过程通过不断提高对于每个视频帧的语义理解来减小循环一致性误差。充分训练后的TCC可以学习出时域的细粒度理解能力,并能够有效对齐相关的视频。

TCC学习到的表达

研究人员随后验证了TCC学习到的表达,是否有效理解了多个视频中的相似动作。实验在Penn Action数据集上进行,研究人员将多个包含人体深蹲训练的视频利用T后发现了空间可视化学习到的隐含特征。

左图中亮度较高的点是当前帧对应的表示。紫色为输入的参考视频,其余为其他视频中检索到的最邻近帧。可以看到虽然各个视频的角度、场景、主体不同,但对应的嵌入表示和对应的视频帧却以相同的趋势在运动,TCC有效地将深蹲动作的不同过程进行了编码而无需显式的人工标注。

TCC的潜在应用

由于这种方法可以有效学习逐帧视频的迁移表达可广泛应用于小样本视频动作分类、无监督视频对齐、多模态迁移和逐帧视频检索。

小样本动作阶段分类。当只有很少的标注视频样本时,TCC方法可以有效地将不同动作阶段进行分类。研究人员将基于TCC的方法与监督学习方法进行比较,可以发现只用一个完全标记的视频样本训练就可与监督学习需要五十个标注的视频样本训练获得同样的效果。下图中可以看到TCC方法在两种动作识别中小样本学习的良好表现。

对齐或同步视频。当视频的数量增加时对齐或同步不同视频间的动作将会是耗时耗力的工作,但利用TCC多个视频的同步可以利用参考视频的帧来在每个目标视频中寻找最邻近的帧实现对齐:

视频标签/模态迁移。由于TCC可以在嵌入空间中找到每一帧对应的最邻近帧进行视频匹配,所以这种方法还可以将视频对应的元数据进行迁移,包括时域语义标签或者音频数据。研究人员展示了一个可以把倒水的声音迁移到一段没有声音的视频上,倒水的声音别成功迁移到了倒牛奶的视频上了,甚至放瓶子的声音也很逼真!

逐帧视频检索。TCC还可以作为关键帧在嵌入空间中用于视频中相似帧的检索。学习出的嵌入表达具有很强的分辨能力,可以区分出某一个动作前后的相邻帧。

研究人员还将整个工作的代码开源,不仅包括了TCC,还包括了多个先进自监督方法的实现,将为会视频理解的研究以及艺术家利用视频同步进行创作带来很大的帮助。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6141

    浏览量

    105080
  • 视频
    +关注

    关注

    6

    文章

    1932

    浏览量

    72806
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24640

原文标题:读懂视频的每分每秒,谷歌提出自监督方法提升视频细粒度理解能力

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一致性测试系统的技术原理和也应用场景

    出现远程调用失败、消息发送失败、并发bug等问题,这些问题最终会导致系统间的数据不一致,导致用户体验受损、用户利益受损。因此,需要一种在线的校验模式来实时发现数据不一致问题,而一致性
    发表于 11-01 15:35

    异构计算下缓存一致性的重要

    在众多回复中,李博杰同学的回答被认为质量最高。他首先将缓存一致性分为两个主要场景:是主机内CPU与设备间的一致性;二是跨主机的一致性
    的头像 发表于 10-24 17:00 276次阅读
    异构计算下缓存<b class='flag-5'>一致性</b>的重要<b class='flag-5'>性</b>

    级联一致性和移相器校准应用手册

    电子发烧友网站提供《级联一致性和移相器校准应用手册.pdf》资料免费下载
    发表于 08-29 10:48 0次下载
    级联<b class='flag-5'>一致性</b>和移相器校准应用手册

    电感值和直流电阻的一致性如何提高?

    提高电感值和直流电阻的一致性,可以从以下几个方面入手: 、提高电感值的一致性 优化磁芯选择 : 磁芯是电感器的关键组成部分,其材料特性和尺寸直接影响电感值。选择具有高磁导率、低磁阻和稳定性能的材料
    的头像 发表于 08-19 15:27 258次阅读

    LIN一致性测试规范2.1

    电子发烧友网站提供《LIN一致性测试规范2.1.pdf》资料免费下载
    发表于 08-15 17:14 3次下载

    新品发布 | 同星智能正式推出CAN总线一致性测试系统

    CAN总线一致性测试系统CANFD/CAN总线一致性测试系统,在硬件系统上基于同星自主研发的总线分析工具,干扰仪,一致性测试机箱,并搭配程控电源,示波器,数字万用表等标准外围仪器设备;在软件上
    的头像 发表于 07-06 08:21 457次阅读
    新品发布 | 同星智能正式推出CAN总线<b class='flag-5'>一致性</b>测试系统

    铜线键合焊接一致性:如何突破技术瓶颈?

    在微电子封装领域,铜线键合技术以其低成本、高效率和良好的电气性能等优势,逐渐成为芯片与基板连接的主流方式。然而,铜线键合过程中的焊接一致性问题是制约其进步发展和应用的关键难题。焊接一致性不仅
    的头像 发表于 07-04 10:12 1654次阅读
    铜线键合焊接<b class='flag-5'>一致性</b>:如何突破技术瓶颈?

    为什么主机厂愈来愈重视CAN一致性测试?

    新能源汽车迅猛发展下整车CAN网络架构日益复杂,总线故障等潜在问题时刻影响着运行安全。整车零部件通过CAN一致性测试必将是安全保障的第道门槛。CAN一致性测试,就是要求整车CAN网络中的节点都满足
    的头像 发表于 05-29 08:24 1107次阅读
    为什么主机厂愈来愈重视CAN<b class='flag-5'>一致性</b>测试?

    华为2020年显示技术专利公开,提升色彩一致性

    该专利实施例提出了一种色彩校正方法、AP芯片、终端以及存储介质,应用于显示技术领域,旨在提升显示画面的色彩一致性。具体而言,色彩校正方法由终
    的头像 发表于 04-29 09:34 379次阅读
    华为2020年显示技术专利公开,提升色彩<b class='flag-5'>一致性</b>

    锂电池组装及维修的关键:电芯一致性的重要

    锂电池组装及维修过程中,电芯一致性个至关重要的概念。电芯一致性指的是在同电池组中,各个电芯在性能参数上的接近程度。这些性能参数包括电压、容量、内阻、自放电率等。电芯
    的头像 发表于 04-15 10:57 943次阅读
    锂电池组装及维修的关键:电芯<b class='flag-5'>一致性</b>的重要<b class='flag-5'>性</b>

     QSFP一致性测试的专业测试设备

    QSFP一致性测试是确保QSFP光模块性能稳定、可靠的关键环节,对于保障通信系统的正常运行具有重要意义。QSFP(Quad Small Form-factor Pluggable)光模块是一种高密度
    的头像 发表于 03-14 10:40 531次阅读
     QSFP<b class='flag-5'>一致性</b>测试的专业测试设备

    铜线键合焊接一致性:微电子封装的新挑战

    在微电子封装领域,铜线键合技术以其低成本、高效率和良好的电气性能等优势,逐渐成为芯片与基板连接的主流方式。然而,铜线键合过程中的焊接一致性问题是制约其进步发展和应用的关键难题。焊接一致性不仅
    的头像 发表于 03-13 10:10 1267次阅读
    铜线键合焊接<b class='flag-5'>一致性</b>:微电子封装的新挑战

    企业数据备份体系化方法论的七大原则:深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别

    在数字化时代,数据备份成为了企业信息安全的核心环节。但在备份过程中,两个关键概念——应用一致性和崩溃一致性,常常被误解或混淆。本文旨在阐明这两个概念的差异,并分析它们在数据备份中的重要,以便读者
    的头像 发表于 03-11 14:05 418次阅读
    企业数据备份体系化<b class='flag-5'>方法</b>论的七大原则:深入理解数据备份的关键原则:应用<b class='flag-5'>一致性</b>与崩溃<b class='flag-5'>一致性</b>的区别

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别 在数字化时代,数据备份成为了企业信息安全的核心环节。但在备份过程中,两个关键概念——应用一致性和崩溃一致性,常常被误解或混淆。
    的头像 发表于 03-11 11:29 838次阅读
    深入理解数据备份的关键原则:应用<b class='flag-5'>一致性</b>与崩溃<b class='flag-5'>一致性</b>的区别

    DDR一致性测试的操作步骤

    DDR一致性测试的操作步骤  DDR(双数据率)一致性测试是对DDR内存模块进行测试以确保其性能和可靠。在进行DDR一致性测试时,需要遵循
    的头像 发表于 02-01 16:24 1343次阅读