0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全面解读CVPR2021-MMAct挑战赛跨模态动作识别双冠方案

深兰科技 来源:DeepTech深科技 作者:DeepTech深科技 2021-06-25 10:53 次阅读

导读

日前,计算机视觉和模式识别领域的三大顶级会议之一CVPR正在进行中,深兰DeepBlueAI团队在动作识别国际挑战赛 (ActivityNet) 研讨会上,参加了 MMAct 挑战赛中仅设的两个赛道——“跨模态裁剪动作识别”和“跨模态未裁剪动作时序定位”,并均以大比分领先取得第一。

冠军方案解读

竞赛要求参赛者提出跨模态视频动作识别/定位方法,以弥补使用 MMAct[1] 数据集的纯视觉方法的缺点。此任务的目标是利用基于传感器的,例如穿戴式传感器数据作为特权信息,以及基于视觉的模态,其方式可以克服训练(传感器 + 视频)和测试(仅视频)阶段之间模态差异所带来的限制。用于此竞赛的多模态数据包括:加速度、方向、陀螺仪、RGB 视频和人体关键点。

挑战赛促进了关于如何通过使用跨模态方法解决视觉挑战的另一种观点,希望扩大对视频动作理解的研究,以进一步利用日常使用的智能设备(例如智能手机)中的传感器。

赛题一

跨模态裁剪动作识别

Cross-Modal Trimmed Action Recognition

在此任务中,参与者使用来自MMAct 的修剪视频以及配对的传感器数据,在数据中包含交叉视角和交叉场景两种类型的数据,共35个动作类别。任务允许参与者使用修剪过的传感器数据和修剪过的视频进行训练,但不能同时使用交叉视角和交叉场景的数据,且仅对修剪过的视频进行测试以进行动作识别,并采用mAP作为评价指标。

赛题难点:

不同视频等多模态数据时序长度变化大,从几秒到几分钟不等;

测试阶段只提供了视频数据。

应用场景:

视频监控、异常行为识别

解决方案:

考虑到视频长度较长,为了有效地捕获视频中的动作信息,团队优先采用了等间隔采样的方式对每个视频进行采样,然后采用随机尺度裁剪、水平翻转等数据增强方式进行增强。

算法选型上,团队优先采用了TSM[2]进行实验,它具有高效率和高性能。具体来说,它可以达到 3D CNN 的性能,但保持 2D CNN 的复杂性。TSM 沿时间维度移动部分通道,从而促进相邻帧之间的信息交换,它还可以插入到 2D CNN 中以实现零计算和零参数的时间建模。

作为对比,团队同时采用了滑动窗口的形式进行帧数据采样,并采用ir-CSN[3]进行实验。CSN探索了通道之间交互的重要性,并达到了节省计算参数和通道之间交互的平衡,网络具有结构精简、计算量小、速度快、准确率好的优点,并且还有一定的正则化能力。

最后,在进行了为每个视频采样不同的帧数,是否添加Non-Local模块,以及MixUp与ColorJitter数据增强的实验之后,团队采用TSM,以ResNet50作为Backbone, 并以等间隔采样的方式采样32帧,最终取得了最好的单模成绩。在融合ir-CSN结果后,取得了最好的线上成绩。

赛题二

跨模态未裁剪动作时序定位

Cross-Modal Untrimmed Action Temporal Localization,在这项任务中,参与者使用来自MMAct 的未修剪视频以及配对的传感器数据,在数据中包含交叉视角和交叉场景两种类型的数据,共35个动作类别。参与者允许使用未修剪的配对传感器数据和视频进行训练,然后在仅包含未修剪的视频数据的测试集上进行时间动作定位,输出未修剪视频中识别的动作类别及其开始和结束时间,并采用AP作为评价指标。

赛题难点:

视频时长较长,从几分钟到十几分钟不等;

测试阶段只提供了视频数据。

应用场景:

视频监控、异常行为识别、定位

解决方案:

考虑到在测试集中只提供了视频数据,因此团队的实现方案主要在视频数据上进行实验。在时序动作定位相关的工作中,主流的方法如BSN[5]、BMN[6]等。需要经过:视频抽帧-》提取光流-》行为识别算法进行特征提取-》时序动作定位算法进行动作定位-》行为识别算法进行动作识别等多个环节,整个方案实现流程十分繁杂。

在实现方案中为了简化方案流程,采用AFSD[7]作为算法实现。这是一个anchor-free的时序定位框架,并且是一个end-to-end使用视频帧作为输入而不是特征作为输入的算法。

为了获得模型的输入,团队对每个视频以动态帧率采样2304帧,并进行光流计算,这样可以保证10分钟以上的视频有大约3帧的采样帧率,不至于丢失过多的视频信息。最后再分别采用RGB数据和光流数据进行训练,并融合两种类型的预测结果后,取得了团队最好成绩。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • RGB
    RGB
    +关注

    关注

    4

    文章

    801

    浏览量

    58673
  • 计算机视觉
    +关注

    关注

    8

    文章

    1700

    浏览量

    46096
  • 数据集
    +关注

    关注

    4

    文章

    1209

    浏览量

    24803
  • 深兰科技
    +关注

    关注

    1

    文章

    58

    浏览量

    6021

原文标题:赛道 | CVPR2021-MMAct挑战赛跨模态动作识别双冠方案解读

文章出处:【微信号:kmdian,微信公众号:深兰科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    优秀奖及决赛阵容震撼公布 第二届OpenHarmony创新应用挑战赛决战在即

    创意和技术潜力。2024年10月21日,第二届OpenHarmony创新应用挑战赛正式启动,题总奖金高达50万元,吸引了全国各地418支参赛队伍的积极参与。 历经两个月的激烈角逐,12支团队脱颖而出,晋级决赛。截至2025年
    的头像 发表于 01-14 09:07 134次阅读
    优秀奖及决赛阵容震撼公布  第二届OpenHarmony创新应用<b class='flag-5'>挑战赛</b>决战在即

    探索具身智能边界,地瓜机器人邀你共战ICRA 2025 Sim2Real挑战赛

    探索具身智能边界,地瓜机器人邀你共战ICRA 2025 Sim2Real挑战赛
    的头像 发表于 01-13 20:18 130次阅读
    探索具身智能边界,地瓜机器人邀你共战ICRA 2025 Sim2Real<b class='flag-5'>挑战赛</b>

    芯华章持续助力EDA精英挑战赛

    日前,2024中国研究生创“芯”大赛·EDA精英挑战赛(以下简称EDA竞赛)决赛在南京江北新区举办。今年EDA竞赛首次升级为国,在全国超过500个参赛队伍中,来自华南理工大学的"EDA240931参赛队"从芯华章赛道脱颖而出,斩获仅有2支队伍能获得的菁英杯大奖,祝贺!
    的头像 发表于 12-17 15:47 369次阅读

    EDA精英挑战赛果公布!思尔芯“战队”薪火相承斩获“麒麟杯”

    2024中国研究生创芯大赛·EDA精英挑战赛12月7-8日,2024中国研究生创芯大赛·EDA精英挑战赛(原“集成电路EDA设计精英挑战赛”)总决赛及颁奖典礼在南京成功举办。此次大赛,思尔芯作为核心
    的头像 发表于 12-11 01:03 412次阅读
    EDA精英<b class='flag-5'>挑战赛</b><b class='flag-5'>赛</b>果公布!思尔芯“战队”薪火相承斩获“麒麟杯”

    e络盟社区携手恩智浦发起智能空间楼宇自动化挑战赛

    安富利旗下全球电子元器件产品与解决方案分销商e络盟社区与恩智浦联合发起围绕智能空间楼宇自动化设计的全新挑战赛。本次挑战赛邀请工程师和技术爱好者利用恩智浦FRDM MCX A 系列(A15X)开发套件,开发创新的解决
    的头像 发表于 11-14 10:44 282次阅读
    e络盟社区携手恩智浦发起智能空间楼宇自动化<b class='flag-5'>挑战赛</b>

    2024年ICPC与华为挑战赛冠军杯圆满落幕

    近日,2024年ICPC&华为挑战赛冠军杯在深圳圆满落幕。该活动由华为和ICPC联合举办,汇聚全球顶尖的编程人才,共同探讨和解决具有挑战性的工业界真实问题,并对未来技术发展趋势及关键挑战展开讨论。今年的
    的头像 发表于 10-27 16:00 878次阅读

    PI助力aCentauri车队在太阳能车挑战赛中大放异彩

    在2023年10月,Power Integrations (PI) 为当时举行的普利司通世界太阳能车挑战赛提供了先进的技术和支持。
    的头像 发表于 10-27 14:08 360次阅读
    PI助力aCentauri车队在太阳能车<b class='flag-5'>挑战赛</b>中大放异彩

    50万奖金池!开放原子大赛——第二届OpenHarmony创新应用挑战赛正式启动

    第二届OpenHarmony创新应用挑战赛作为开放原子大赛旗下的重要项,聚焦 OpenHarmony应用开发,致力提升开发者的动手实践能力与开发创新应用的能力。 项要求开发者
    发表于 10-24 15:40

    NVIDIA Research端到端自动驾驶模型引领国际挑战赛

    NVIDIA 在国际计算机视觉与模式识别会议(CVPR)上展示了用于自动驾驶汽车开发的加速计算和生成式 AI 的突破技术。
    的头像 发表于 09-09 10:11 557次阅读

    NVIDIA为AI城市挑战赛构建合成数据集

    在一年一度的 AI 城市挑战赛中,来自世界各地的数百支参赛队伍在 NVIDIA Omniverse 生成的基于物理学的数据集上测试了他们的 AI 模型。
    的头像 发表于 09-09 10:04 534次阅读

    AI4Science黑客松光子计算挑战赛成功举办

    经过数月角逐,第二届AI4Science黑客松竞赛日前落下帷幕。在曦智科技主持的光子计算挑战赛中,参赛选手何自强和来自东北大学的参赛队伍The Power of Light获得完优胜奖。
    的头像 发表于 08-07 09:58 596次阅读

    思尔芯题正式发布,邀你共战EDA精英挑战赛

    题发布COMPETITIONRELEASE2024中国研究生创芯大赛·EDA精英挑战赛(原“集成电路EDA设计精英挑战赛”)现已正式拉开帷幕。作为核心出题企业之一思尔芯(S2C),已经为你们准备了
    的头像 发表于 08-03 08:24 732次阅读
    思尔芯<b class='flag-5'>赛</b>题正式发布,邀你共战EDA精英<b class='flag-5'>挑战赛</b>!

    浪潮信息获CVPR2024自动驾驶挑战赛&quot;Occupancy&amp; Flow&quot;冠军

    北京2024年6月25日 /美通社/ -- 近日,在全球权威的CVPR 2024自动驾驶国际挑战赛(Autonomous Grand Challenge)中,浪潮信息AI团队所提交的"F-OCC
    的头像 发表于 06-25 20:29 424次阅读
    浪潮信息获<b class='flag-5'>CVPR</b>2024自动驾驶<b class='flag-5'>挑战赛</b>&quot;Occupancy&amp; Flow&quot;冠军

    格灵深瞳斩获首届花样滑冰动作识别竞赛夺冠

    近日,第一届花样滑冰动作识别挑战赛公布了本次竞赛的结果,格灵深瞳凭借领先的算法能力斩获了冠军,并包揽了本次挑战赛的前两名。
    的头像 发表于 05-13 14:04 450次阅读
    格灵深瞳斩获首届花样滑冰<b class='flag-5'>动作</b><b class='flag-5'>识别</b>竞赛夺冠

    触景无限荣获英特尔边缘挑战赛全球Top10,致力发展工业新生产力

    近日,触景无限科技凭借卓越的技术实力和创新的解决方案:《电厂热力管道监测》(OCR赛道)与《尾矿库风险监测》(缺陷检测赛道),在2023英特尔边缘解决方案挑战赛中喜获殊荣,成功入选全球Top10。
    的头像 发表于 02-25 15:24 1143次阅读