0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

智能感知与物联网技术研究所 来源:未知 2023-06-11 21:40 次阅读

Tracking Everything Everywhere All at Once.

前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。

现在,一项称为「追踪一切」的新研究为动态视频中的运动估计提出了新方法,能够准确、完整地追踪物体的运动轨迹。

该研究由来自康奈尔大学、谷歌研究院和 UC 伯克利的研究者共同完成。他们联合提出了一种完整且全局一致的运动表征 OmniMotion,并提出一种新的测试时(test-time)优化方法,对视频中每个像素进行准确、完整的运动估计。

04c39d40-085d-11ee-962d-dac502259ad0.png

  • 论文地址:https://arxiv.org/abs/2306.05422

  • 项目主页:https://omnimotion.github.io/

有网友在推特上转发了这项研究,仅一天时间就收获了 3500 + 的点赞量,研究内容大受好评。

从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹:

荡秋千的运动曲线:

还能交互式查看运动追踪情况:

即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:

在计算机视觉领域,常用的运动估计方法有两种:稀疏特征追踪和密集光流。但这两种方法各有缺点,稀疏特征追踪不能建模所有像素的运动;密集光流无法长时间捕获运动轨迹。

该研究提出的 OmniMotion 使用 quasi-3D 规范体积来表征视频,并通过局部空间和规范空间之间的双射(bijection)对每个像素进行追踪。这种表征能够保证全局一致性,即使在物体被遮挡的情况下也能进行运动追踪,并对相机和物体运动的任何组合进行建模。该研究通过实验表明所提方法大大优于现有 SOTA 方法。

方法概述

该研究将帧的集合与成对的噪声运动估计(例如光流场)作为输入,以形成整个视频的完整、全局一致的运动表征。然后,该研究添加了一个优化过程,使其可以用任何帧中的任何像素查询表征,以在整个视频中产生平滑、准确的运动轨迹。值得注意的是,该方法可以识别画面中的点何时被遮挡,甚至可以穿过遮挡追踪点。

OmniMotion 表征

传统的运动估计方法(例如成对光流),当物体被遮挡时会失去对物体的追踪。为了在遮挡的情况下也能提供准确、一致的运动轨迹,该研究提出全局运动表征 OmniMotion。

该研究试图在没有显式动态 3D 重建的情况下准确追踪真实世界的运动。OmniMotion 表征将视频中的场景表示为规范的 3D 体积,通过局部规范双射(local-canonical bijection)映射成每个帧中的局部体积。局部规范双射被参数化为神经网络,并在不分离两者的情况下捕获相机和场景运动。基于此种方法,视频可以被视为来自固定静态相机局部体积的渲染结果。

wKgaomTYgtOAbH4KAAXBMZBqqCE495.png

由于 OmniMotion 没有明确区分相机和场景运动,所以形成的表征不是物理上准确的 3D 场景重建。因此,该研究称其为 quasi-3D 表征。

OmniMotion 保留了投影到每个像素的所有场景点的信息,以及它们的相对深度顺序,这让画面中的点即使暂时被遮挡,也能对其进行追踪。

实验及结果

定量比较

研究者将提出的方法与 TAP-Vid 基准进行比较,结果如表 1 所示。可以看出,在不同的数据集上,他们的方法始终能实现最佳的位置准确性、遮挡准确性和时序一致性。他们的方法可以很好地处理来自 RAFT 和 TAP-Net 的不同的成对对应输入,并且在这两种基准方法上提供了一致的改进。

0d73db26-085d-11ee-962d-dac502259ad0.png

定性比较

如图 3 所示,研究者对他们的方法和基线方法进行了定性比较。新方法在(长时间)遮挡事件中显示出了出色的识别和追踪的能力,同时在遮挡期间为点提供合理的位置,并处理很大的摄像机运动视差。

wKgZomTYgxOAVFZRAAepLTl23yo522.png

消融实验与分析

研究者利用消融实验来验证他们设计决策的有效性,结果如表 2 所示。

0e4b0f56-085d-11ee-962d-dac502259ad0.png

在图 4 中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。

wKgaomTYgy6APHeiAAcuO0q5oxM428.png

需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。更多的消融实验和分析结果可以在补充材料中找到。


原文标题:随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2903

    文章

    44284

    浏览量

    371315

原文标题:随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    《DNK210使用指南 -CanMV版 V1.0》第三十六章 image图像色块追踪实验

    第三十六章 image图像色块追踪实验 在上章节中,介绍了image模块中图像特征检测方法给的使用,本章将继续介绍image模块中图像色块追踪方法的使用。通过本章的学习,读者将学习到image模块
    发表于 11-07 09:30

    基于光线追踪的渲染算法实现

    我们已经涵盖了所有需要说的内容!我们现在准备写我们的第个光线追踪器。你现在应该能够猜到光线追踪算法是如何工作的了。首先,注意到自然界中光的传播只是从光源发出无数条射线,反弹直到它们撞
    的头像 发表于 10-30 08:06 211次阅读
    基于光线<b class='flag-5'>追踪</b>的渲染<b class='flag-5'>算法</b>实现

    园区封闭化管理之人员和车辆定位及轨迹追踪

    如今园区封闭化管理的需求越来越普遍,特别是化工类的园区,为了实现对园区内人员和车辆的准确高效管控,人车定位及轨迹追踪技术应运而生。本文将介绍这技术在园区封闭化管理中的重要作用。 、 什么是人车
    的头像 发表于 10-11 11:20 281次阅读
    园区封闭化管理之人员和车辆定位及轨迹<b class='flag-5'>追踪</b>

    无线定位器追踪器跟手机怎么连接

    无线定位器追踪器与手机的连接方法主要取决于追踪器的类型和功能。以下是些常见的连接方式: 、蓝牙连接 确保兼容性 :首先,确保你的定位器追踪
    的头像 发表于 09-29 10:01 1118次阅读

    如何远离网络追踪

    分享如何避免被网络追踪。   常见的网络追踪方式 1.IP 地址追踪每个设备在网络上都会匹配唯 IP 地址,通过该 IP 地址可以确定设
    的头像 发表于 09-03 16:57 332次阅读
    如何远离网络<b class='flag-5'>追踪</b>

    迅为RK3588开发板RKNPU2项目实战2SORT目标追踪

    1.介绍和视频演示 2.在模拟器实现图片的目标追踪 3.板推理和嵌入式部署 4.视频目标追踪的实现(python) 5.C++实现目标
    发表于 07-10 11:08

    英伦科技裸眼3D平板电脑——便携尺寸,随时随地的私人影院

    随着科技的快速发展,我们的娱乐和生活方式正在经历前所未有的变革。如今,英伦科技以其颠覆性的裸眼3D平板电脑再次突破想象的边界,为用户带来场无与伦比的视觉盛宴。这款产品不仅让你摆脱了沉重的VR设备和专用眼镜,更以其10.1寸的便携尺寸,让精彩世界随时随地随心展开。
    的头像 发表于 06-13 10:35 305次阅读
    英伦科技裸眼3D平板电脑——便携尺寸,<b class='flag-5'>随时随地</b>的私人影院

    如何利用NVIDIA中的单视角3D追踪功能减轻视觉感知中的遮挡现象?

    说到智能视频分析(IVA)应用(如交通监控、仓库安全和零售消费者分析)的感知,最大的挑战之就是遮挡
    的头像 发表于 05-17 10:36 393次阅读
    如何利用NVIDIA中的单视角3D<b class='flag-5'>追踪</b>功能减轻视觉感知中的<b class='flag-5'>遮挡</b>现象?

    卡尔曼滤波是什么 卡尔曼滤波与目标追踪技术分析

    卡尔曼滤波以及其扩展算法能够应用于目标状态估计,如果这个目标是行人,那么就是行人状态估计(或者说行人追踪),如果这个目标是自身,那么就是车辆自身的追踪(结合些地图的先验,GPS等数据
    的头像 发表于 04-29 09:46 828次阅读
    卡尔曼滤波是什么 卡尔曼滤波与目标<b class='flag-5'>追踪</b>技术分析

    4G路由器:让你随时随地畅享网络便利

    当今时代无论是浏览新闻、查阅资料,还是在线购物、远程办公,甚至是视频会议和在线教育,网络都发挥着无可替代的作用。然而,传统的有线路由器由于其固定的位置和连接方式,往往限制了我们的网络使用范围。为了解决这问题,4G路由器应运而生,它凭借其便携性和移动性,让我们
    的头像 发表于 04-09 15:05 471次阅读

    追踪跳线都用哪些场景

    鹰眼追踪跳线是种用于机房管理的工具,可以查询铜缆和光缆(包括超五类、六类、超六类屏蔽/非屏蔽,单模/多模光纤等)。其应用场景包括但不限于: 机房管理:机房是网络设备的核心区域,鹰眼追踪跳线可用
    的头像 发表于 03-21 10:03 391次阅读

    追踪跳线是电子光纤配线架上专用的吗?

    是的,追踪跳线通常是在电子光纤配线架(Electronics Fiber Distribution Frame,EFDF)上使用的专用跳线。EFDF是个中心化的电子光纤交叉配线架,通常
    的头像 发表于 03-16 14:51 418次阅读

    随时随地办公无忧!讯飞星火AI商务键盘长续航

    作为名经常出差的商务人士,我深知办公效率的重要性。以前,我总是为繁琐的办公操作而烦恼,但是现在,有了科大讯飞AI智能键盘D1,办公效率大大提高,让我随时随地办公无忧! 外观小巧轻便,很方便
    的头像 发表于 01-05 15:49 687次阅读
    <b class='flag-5'>随时随地</b>办公无忧!讯飞星火AI商务键盘长续航

    追踪器arduino原理

    追踪器 (LDR) 是种基于光敏电阻的光测量器件,常用于测量光强度和控制感应器。在 Arduino 上使用 LDR,可以实现对光线进行检测、测量和控制的功能。本文将详细介绍 LDR
    的头像 发表于 12-08 10:22 1412次阅读

    低功耗蓝牙模块在运动健身追踪中的革新应用

    随着健康和健身意识的不断提升,人们对运动追踪技术的需求日益增加。低功耗蓝牙模块的引入为运动健身追踪领域带来了新的可能性。本文将探讨低功耗蓝牙模块在运动健身追踪中的创新应用,重点关注其在
    的头像 发表于 11-29 14:50 430次阅读