0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

智能感知与物联网技术研究所 来源:未知 2023-06-11 21:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Tracking Everything Everywhere All at Once.

前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。

现在,一项称为「追踪一切」的新研究为动态视频中的运动估计提出了新方法,能够准确、完整地追踪物体的运动轨迹。

该研究由来自康奈尔大学、谷歌研究院和 UC 伯克利的研究者共同完成。他们联合提出了一种完整且全局一致的运动表征 OmniMotion,并提出一种新的测试时(test-time)优化方法,对视频中每个像素进行准确、完整的运动估计。

04c39d40-085d-11ee-962d-dac502259ad0.png

  • 论文地址:https://arxiv.org/abs/2306.05422

  • 项目主页:https://omnimotion.github.io/

有网友在推特上转发了这项研究,仅一天时间就收获了 3500 + 的点赞量,研究内容大受好评。

从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹:

荡秋千的运动曲线:

还能交互式查看运动追踪情况:

即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:

在计算机视觉领域,常用的运动估计方法有两种:稀疏特征追踪和密集光流。但这两种方法各有缺点,稀疏特征追踪不能建模所有像素的运动;密集光流无法长时间捕获运动轨迹。

该研究提出的 OmniMotion 使用 quasi-3D 规范体积来表征视频,并通过局部空间和规范空间之间的双射(bijection)对每个像素进行追踪。这种表征能够保证全局一致性,即使在物体被遮挡的情况下也能进行运动追踪,并对相机和物体运动的任何组合进行建模。该研究通过实验表明所提方法大大优于现有 SOTA 方法。

方法概述

该研究将帧的集合与成对的噪声运动估计(例如光流场)作为输入,以形成整个视频的完整、全局一致的运动表征。然后,该研究添加了一个优化过程,使其可以用任何帧中的任何像素查询表征,以在整个视频中产生平滑、准确的运动轨迹。值得注意的是,该方法可以识别画面中的点何时被遮挡,甚至可以穿过遮挡追踪点。

OmniMotion 表征

传统的运动估计方法(例如成对光流),当物体被遮挡时会失去对物体的追踪。为了在遮挡的情况下也能提供准确、一致的运动轨迹,该研究提出全局运动表征 OmniMotion。

该研究试图在没有显式动态 3D 重建的情况下准确追踪真实世界的运动。OmniMotion 表征将视频中的场景表示为规范的 3D 体积,通过局部规范双射(local-canonical bijection)映射成每个帧中的局部体积。局部规范双射被参数化为神经网络,并在不分离两者的情况下捕获相机和场景运动。基于此种方法,视频可以被视为来自固定静态相机局部体积的渲染结果。

wKgaomTYgtOAbH4KAAXBMZBqqCE495.png

由于 OmniMotion 没有明确区分相机和场景运动,所以形成的表征不是物理上准确的 3D 场景重建。因此,该研究称其为 quasi-3D 表征。

OmniMotion 保留了投影到每个像素的所有场景点的信息,以及它们的相对深度顺序,这让画面中的点即使暂时被遮挡,也能对其进行追踪。

实验及结果

定量比较

研究者将提出的方法与 TAP-Vid 基准进行比较,结果如表 1 所示。可以看出,在不同的数据集上,他们的方法始终能实现最佳的位置准确性、遮挡准确性和时序一致性。他们的方法可以很好地处理来自 RAFT 和 TAP-Net 的不同的成对对应输入,并且在这两种基准方法上提供了一致的改进。

0d73db26-085d-11ee-962d-dac502259ad0.png

定性比较

如图 3 所示,研究者对他们的方法和基线方法进行了定性比较。新方法在(长时间)遮挡事件中显示出了出色的识别和追踪的能力,同时在遮挡期间为点提供合理的位置,并处理很大的摄像机运动视差。

wKgZomTYgxOAVFZRAAepLTl23yo522.png

消融实验与分析

研究者利用消融实验来验证他们设计决策的有效性,结果如表 2 所示。

0e4b0f56-085d-11ee-962d-dac502259ad0.png

在图 4 中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。

wKgaomTYgy6APHeiAAcuO0q5oxM428.png

需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。更多的消融实验和分析结果可以在补充材料中找到。


原文标题:随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2950

    文章

    48101

    浏览量

    418111

原文标题:随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    共享车辆追踪:为什么选LoRa?

    共享车辆频繁丢失、GPS室内失效、传统定位成本高昂—这些行业痛点如何破解?本文深入解析LoRa技术如何通过超低功耗、超远通信、超强隐蔽三大核心优势,为共享车辆打造经济可靠的定位追踪方案。背景随着共享
    的头像 发表于 03-23 11:34 1037次阅读
    共享车辆<b class='flag-5'>追踪</b>:为什么选LoRa?

    电子凸轮同步追踪的方案分析

    电子凸轮同步追踪技术作为工业自动化领域的核心控制策略,其本质是通过软件算法模拟机械凸轮的运动特性,实现多轴间的高精度相位同步。该技术突破了传统机械凸轮的物理限制,在包装机械、印刷设备、数控机床等场景中展现出显著优势。以下从技术原理、实现方案及行业应用三个维度展开深度分析。
    的头像 发表于 03-02 17:13 696次阅读

    BLE SoC,如何助力管理者实现高效的资产追踪

    基于BLE SoC的资产追踪方案,具备低功耗、高集成和生态成熟,实现高效资产定位与管理。
    的头像 发表于 12-22 14:16 408次阅读
    BLE SoC,如何助力管理者实现高效的资产<b class='flag-5'>追踪</b>?

    蓝牙定位追踪技术:从技术原理、核心优势详解(

    蓝牙定位追踪技术利用RSSI或AoA/AoD,通过信标、网关或多天线阵列实现室内精准定位,具备低功耗、低成本、易部署、抗干扰强等优势,广泛应用于工业、仓储、楼宇等场景的人员与资产管理。
    的头像 发表于 12-17 14:30 928次阅读

    索尼基于时识科技Speck2f芯片打造可穿戴眼动追踪系统

    传统帧式相机长期受高功耗瓶颈制约,可穿戴设备难以实现持续眼动追踪。近日,索尼研究团队基于时识科技(SynSense)Speck2f芯片,成功研发出全球首个全集成、电池供电的可穿戴眼动追踪系统。该方案
    的头像 发表于 12-04 17:05 1268次阅读

    物联网RFID物流追踪技术是什么?其技术原理和应用场景

    本文深入探讨RFID在物流追踪中的技术原理、应用场景、行业数据与落地策略,面向供应链与技术负责人,帮助你理解并推进从仓储、运输到最后公里的 RFID 项目。
    的头像 发表于 11-11 10:58 901次阅读
    物联网RFID物流<b class='flag-5'>追踪</b>技术是什么?其技术原理和应用场景

    设备管理进入 “手机时代”:随时随地盯生产成常态

    对于企业而言,拥抱设备管理的 “手机时代” 已不是选择题,而是提升核心竞争力的必修课。套好用的手机端设备管理系统,如同给每台设备配备专属 “管家”,让管理者随时随地掌控生产脉搏,线人员告别繁琐流程,最终实现 “少停机、降成本
    的头像 发表于 11-07 10:02 461次阅读
    设备管理进入 “手机时代”:<b class='flag-5'>随时随地</b>盯生产成常态

    目标追踪的简易实现:模板匹配

    直不变的,当目标靠近或者远离摄像头的时候,在视频中就会表现出目标尺度大小的变化,这给算法的自适应能力带来了挑战;遮挡与消失,即目标物体在运
    发表于 10-28 07:21

    泰凌微电子TL721X SoC破解智能追踪痛点

    当智能追踪从 “可选功能” 变成 “生活刚需”,用户对设备的兼容性、精准度、续航力提出了更高要求。泰凌微电子深耕无线连接技术多年,重磅推出的TL721X SoC,凭借对双生态的深度适配、双技术的精准
    的头像 发表于 10-10 09:10 1741次阅读

    拼多多商品推广链接生成API:社交裂变的转化追踪利器

    ​ 在社交电商时代,拼多多通过 商品推广链接生成API 为商家提供了精准的流量转化解决方案。该工具不仅简化了社交裂变活动的落地,更实现了全链路转化效果追踪,成为提升营销效率的核心引擎。 、核心
    的头像 发表于 09-08 16:22 976次阅读
    拼多多商品推广链接生成API:社交裂变的转化<b class='flag-5'>追踪</b>利器

    资产追踪设备市场对Cat.1模组与NTN的融合需求

    的兴起,Cat.1模组市场将呈现持续增长态势。预计到2025年,全球Cat.1模组出货量将突破1.8亿片,其中资产追踪领域占比超过30% ;到2030年,Cat.1模组在资产追踪设备中的渗透率仍将保持在65%以上,主要依赖其成本优势和与NTN的协同方案。这
    的头像 发表于 08-25 15:53 855次阅读

    如何使用树莓派与OpenCV实现面部和运动追踪的云台系统?

    大家好,这是个树莓派和OpenCV的连载专题。使用树莓派与OpenCV实现姿态估计和面部特征点追踪使用树莓派与OpenCV实现面部和运动追踪的云台系统使用树莓派和OpenCV实现手部识别与手指识别
    的头像 发表于 08-14 17:45 2316次阅读
    如何使用树莓派与OpenCV实现面部和运动<b class='flag-5'>追踪</b>的云台系统?

    用树莓派追踪400公里内的飞机?

    都能掌握它们的详细信息,包括它们之前的飞行轨迹。这一切都要归功于树莓派和FlightAwareProStick。将它们组合在起,你就能创建个PiAware系统
    的头像 发表于 08-08 14:59 937次阅读
    用树莓派<b class='flag-5'>追踪</b>400公里内的飞机?

    资产追踪与室内导航

    面展现出巨大潜力。 :资产追踪 资产追踪是指通过技术手段实时监控物理资产的位置、状态和使用情况,帮助企业优化资源利用,减少丢失或闲置。无论是医疗设备、物流货物还是零售库存,资产追踪
    的头像 发表于 07-04 18:22 662次阅读

    明远智睿SSD2351开发板:视频监控领域的卓越之选

    ,如移动硬盘,用于存储大量的视频数据。TF卡接口作为本地存储的补充,方便进行视频数据的临时存储和备份。以太网和WIFI接口则实现了视频数据的远程传输,用户可以通过网络随时随地查看监控画
    发表于 05-30 10:24