0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深兰科技DeepBlueAI团队斩获低分辨率视频行为识别挑战赛的冠军

深兰科技 来源:DeepBlue深兰科技 作者:DeepBlue深兰科技 2021-06-30 10:19 次阅读

导读近日,全球三大计算机视觉顶级会议之一CVPR如期举行,深兰科技DeepBlueAI团队斩获TinyAction Challenge(低分辨率视频行为识别挑战赛)的冠军。

TinyAction Challenge是第六届动作识别国际挑战赛系列竞赛之一,该系列竞赛由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主办,旨在推动视频理解的进一步发展。

冠军方案解读

赛题介绍

TinyAction Challenge使用TinyVirat-v2[1]数据集,旨在提高低分辨率高噪声等真实监控场景下的视频行为识别能力。比赛提供大量真实场景视频片段及标注,每个视频片段中可能含有多个动作,本质是一个多标签的行为识别任务,比赛结果采用precision、recall、F1-score等多个指标来评测。

赛题难点

视频分辨率很低,最小只有10x10像素尺度;

视频尺度多样,从10x10到128x128不等;

视频质量较差,含有大量噪声;

视频场景多样,行为多样,每个视频可能含有多个行为。

解决方案

算法选择上,团队广泛尝试了TSM[2]、TPN-Slowonly[3]等经典算法,最终采用交互移除的CSN[4](ir-CSN)模型,在保证性能的前提下适当减少计算量,同时减轻对数据的过拟合。

数据增强方面,训练时团队首先随机调整尺度裁剪,再统一调整尺度到128x128,最后再随机翻转。而在测试时,通过Tencrop,即对视频帧及其水平翻转在中心与四角区域分别裁剪求平均,有效提高了inference时单模型性能。

测试阶段团队进一步使用了五折交叉验证的模型融合方法。另外由于观察到在比赛数据集的26类行为中有些类别是互斥的,因而对最终的结果添加了后处理规则,使得F1指标进一步提高0.6个点。通过一步步优化,DeepBlueAI团队单模型的F1指标即超过了第二名达到0.4447,并最终达到0.4782,实现大幅度领先。

总结

在本次比赛中,团队对任务及数据做了仔细的分析,合理地选择了模型算法,进行了精细的模型训练,同时在数据的后处理上做了大量的优化,有效实现了低分辨率高噪声视频中行为识别,并最终获得冠军。相信随着计算机视觉及多模态技术的深入发展,行为识别等视频理解问题能够得到更好的解决,并获得越来越广泛的实际应用。

参考文献:

[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394

[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.

[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.

[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    8

    文章

    1696

    浏览量

    45925
  • 高噪声率
    +关注

    关注

    0

    文章

    2

    浏览量

    5992
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24636
  • CSN
    CSN
    +关注

    关注

    0

    文章

    2

    浏览量

    8790
  • 深兰科技
    +关注

    关注

    1

    文章

    55

    浏览量

    5951

原文标题:赛道 | CVPR2021深兰冠军方案解读- TinyAction Challenge低分辨率视频行为识别挑战赛

文章出处:【微信号:kmdian,微信公众号:深兰科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    视频处理器的分辨率是如何管理的

        随着电子应用技术和消费市场的不断发展,LED显示屏的显示单元之间的间距正在逐渐缩小,然而,显示屏的整体面积却在不断扩大。为了满足这一趋势下对超大输出分辨率的需求,视频处理器和拼接器变得
    的头像 发表于 11-11 15:25 169次阅读
    <b class='flag-5'>视频</b>处理器的<b class='flag-5'>分辨率</b>是如何管理的

    冠军说|第二届OpenHarmony竞赛训练营冠军团队专访

    实现技术创新,解决现实问题的呢? 高校创新技术人才又将如何助力OpenHarmony技术生态的繁荣与活力? 点击下方视频一起听冠军说 探秘冠军团队与老师的独家幕后分享 OpenHarmony 竞赛
    发表于 10-28 17:11

    2024年ICPC与华为挑战赛冠军杯圆满落幕

    近日,2024年ICPC&华为挑战赛冠军杯在深圳圆满落幕。该活动由华为和ICPC联合举办,汇聚全球顶尖的编程人才,共同探讨和解决具有挑战性的工业界真实问题,并对未来技术发展趋势及关键挑战
    的头像 发表于 10-27 16:00 635次阅读

    视频超分技术是指什么?

    ‍‍超分辨率技术(SuperResolution),是通过硬件或软件的方法提高图像或视频帧的分辨率,通过一系列低分辨率图像获取到高分辨率图像
    的头像 发表于 09-04 08:05 323次阅读
    <b class='flag-5'>视频</b>超分技术是指什么?

    VR显示器分辨率的选择

    显示器能够提供更加清晰、细腻的画面,让用户在虚拟现实世界中获得更加真实的感受。 1.2 分辨率与舒适度 除了视觉体验外,分辨率还与用户的舒适度密切相关。低分辨率的VR显示器容易产生纱窗效应(Screen Door Effect)
    的头像 发表于 07-08 10:29 947次阅读

    格灵深瞳斩获首届花样滑冰动作识别竞赛夺冠

    近日,第一届花样滑冰动作识别挑战赛公布了本次竞赛的结果,格灵深瞳凭借领先的算法能力斩获冠军,并包揽了本次挑战赛的前两名。
    的头像 发表于 05-13 14:04 380次阅读
    格灵深瞳<b class='flag-5'>斩获</b>首届花样滑冰动作<b class='flag-5'>识别</b>竞赛夺冠

    基于CNN的图像超分辨率示例

    考虑单个低分辨率图像,首先使用双三次插值将其放大到所需的大小,这是执行的唯一预处理。将插值图像表示为Y。我们的目标是从Y中恢复与真实高分辨率图像X尽可能相似的图像F (Y) 。
    的头像 发表于 03-11 11:40 649次阅读
    基于CNN的图像超<b class='flag-5'>分辨率</b>示例

    EVAL_PASCO2_SENSOR为什么无法从较低的分辨率高速获得更高的分辨率

    捕获,同时高速传输较低分辨率(640x480,1280x720,1920x1080)时,静止请求被触发,它正在从一种分辨率转移到另一种分辨率,但无法进行静态捕获。 我在调试时观察到了以下几点: 1
    发表于 02-22 07:58

    编码器分辨率是什么意思 编码器分辨率和脉冲数的关系

    按照编码器支持的分辨率可以把编码器分成标清编码器、高清编码器、全高清编码器,分辨率越高帧率越高视频就越清楚。 1.编码器的分辨率是什么意思 编码器的
    的头像 发表于 02-21 18:07 3907次阅读
    编码器<b class='flag-5'>分辨率</b>是什么意思 编码器<b class='flag-5'>分辨率</b>和脉冲数的关系

    什么是DSR(动态超级分辨率)?DSR是做什么的?如何开启DSR技术?

    使用高分辨率渲染来模拟更高的显示分辨率,然后重采样到实际的显示分辨率,以提供更高质量的图像。 DSR的主要目标是在较低分辨率的情况下提供更好的图像质量。传统上,较低的
    的头像 发表于 01-17 11:17 1.3w次阅读

    镜头分辨率简述

    分辨率可以从显示分辨率与图像分辨率两个方向来分类。
    的头像 发表于 01-15 11:12 879次阅读

    峰峰值分辨率与有效分辨率的区别

    低带宽、高分辨率ADC的分辨率为16位或24位。但是,器件的有效位数受噪声限制,而噪声则取决于输出字速率和所用的增益设置。有些公司规定使用有效分辨率来表示该参数,ADI则规定使用峰峰值分辨率
    发表于 12-15 07:56

    HDBaseT传输器支持传输4K30及以下分辨率吗?

    传输器广泛应用于家庭娱乐系统、商业展示、会议室等场景。 在传输视频信号方面,HDBaseT传输器支持多种分辨率,包括但不限于4K30及以下分辨率。这意味着它可以传输4K分辨率
    的头像 发表于 12-07 09:07 451次阅读

    SAFA:高效时空视频分辨率的尺度自适应特征聚合

    的问题,考虑把插帧做到特征图上,即 低分辨率帧 -> 编码成特征 -> 特征图上插帧 -> 解码得到高分辨率帧。
    的头像 发表于 11-29 16:31 732次阅读
    SAFA:高效时空<b class='flag-5'>视频</b>超<b class='flag-5'>分辨率</b>的尺度自适应特征聚合