0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里达摩院提出MogFace:人脸检测新工作

CVer 来源:CVer 作者:CVer 2022-11-29 15:24 次阅读

一、开源

77fd25c0-6f37-11ed-8abf-dac502259ad0.png

MogFace: Towards a Deeper Appreciation on Face Detection

1. 论文链接:

https://openaccess.thecvf.com/content/CVPR2022/papers/Liu_MogFace_Towards_a_Deeper_Appreciation_on_Face_Detection_CVPR_2022_paper.pdf

2. 代码模型:

https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

3. 可玩应用:

https://modelscope.cn/studios/baigui/face_album/summary

二、背景

人脸检测算法是在一幅图片或者视频序列中检测出来人脸的位置,给出人脸的具体坐标,一般是矩形坐标。它是人脸关键点、属性、编辑、风格化、识别等模块的基础。本文通过实验观察发现,对应设计出如下三个模块构建出一个高性能的人脸检测器MogFace:1.)动态标签分配策略(dynamic label assignment),2.)误检上下文相关性分析(FP context analysis),3.)金字塔层级监督信号分配(pyramid layer level GT assignment)。该方法的模型在WIDER FACE榜单上取得了截止目前将近两年的六项第一。

三、观察

1.1 动态标签分配策略(dynamic label assignment)

为每个anchor点定义cls和reg目标是训练检测器的必要过程,在人脸检测中这个过程称之为标签分配(Label Assignment)。最近,标签分配吸引了诸多研究人员的注意,在人脸检测及通用物体检测领域提出了一系列方法,例如:OTA、PAA,ATSS以及HAMBox。如示例图(a),标签分配过程依赖4个元素。分别是:1.)offline information: a.)IoU (anchor与ground-truth框的IoU) , b.)CPD (anchor与ground-truth中心点的距离) ,2.)online information: a.)PCS (cls分支对anchor的前景分类概率值) ,b.)PLC (reg分支对anchor的预测坐标值)。

781a5fd2-6f37-11ed-8abf-dac502259ad0.png

但是,目前的标签分配方法存在三个问题。1.)若只用offline information做静态标签分配,那么会有很多具备更强回归能力的negative anchor无法被有效利用起来,会导致标签分配策略欠饱和。2.)若过度信任online information动态调整正负anchor时(如OTA和Hambox),由于online information属于预测信息可信度不高,会导致标签分配策略错误多, 极端情况下会陷入trivial 的分配结果。3.) 若引入大量超参 (K in ATSS, alpha in OTA)做标签分配,则当数据集分布发生变化时,需要大量的调参时间。

1.2 误检上下文相关性分析(FP context analysis)

在实际应用中,人脸检测器并不会十分care AP的指标,而对误检(false positive [FP])的数量十分敏感。针对这个问题,目前的做法是收集大量带有FP的图片去fine-tune或者from scratch训练检测器,来帮助检测器了解更多范式的FP,但是我们发现有些频繁出现在训练集中的的FP在这种策略下无法有效解决。这篇文章,我们发现了一个有趣的现象:对于同一个FP,当它的context发生变化时,对于同一个检测器来说它可能就不是FP了。如下图(c),最左面的图片里日历是FP,剩余两张日历都不是FP。

783f0d50-6f37-11ed-8abf-dac502259ad0.png

1.3 金字塔层级监督信号分配(pyramid layer level GT assignment)

scale-level 数据增强策略常常作通用物体检测以及人脸检测中解决scale variance主要手段。如图(b)所示,相对于COCO,人脸检测数据集Wider Face 中人脸的尺度分布更为严峻。为此,我们分提出了一个新的问题,如何合理的分配ground-truth 在不同pyramidlayer上的分布?即检测器的性能与每个pyramidlayer匹配ground-truth的个数之间的关系是什么?是否越多越好?通过严格的对比实验我们发现:“对于所有的pyramid layer来说,并不是这个pyramid layer匹配到越多的ground-truth就越好”。这说明要挖掘每一个pyramidlayer的最好性能,需要控制在这个pyramidlayer上的ground-truth分配的比例。

785e88d8-6f37-11ed-8abf-dac502259ad0.png

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

针对上述“动态标签分配策略(dynamic label assignment)”观察分析,本文提出了在里面一种自适应的在线增量锚挖掘策略(Ali-AMS),它基于standard anchor matching 策略,并进一步adaptive 帮助outlier face匹配anchor。如下:

7880139a-6f37-11ed-8abf-dac502259ad0.png

2.2 Hierachical Context-Aware Module (HCAM)

基于上述“误检上下文相关性分析(FP context analysis)”观察分析,发现“对于同一个FP,当它的context发生变化时,对于同一个检测器来说他可能就不是FP了”,我们进一步提出了一个two-step的模块来显示的encode context 信息来帮助区分FP和TP,显著减少了FP的数量。

7895de46-6f37-11ed-8abf-dac502259ad0.png

2.3 Selective Scale Enhancement Strategy (SSE)

基于上述的“金字塔层级监督信号分配(pyramid layer level GT assignment)”观察分析,发现“对于所有的pyramid layer来说,并不是这个pyramid layer匹配到越多的ground-truth就越好”,我们提出通过控制pyramid layer 匹配的ground-truth的数量来最大化pyramid layer 的性能。

78b71a5c-6f37-11ed-8abf-dac502259ad0.png

五、实验

3.1 Ablation Study

78d401a8-6f37-11ed-8abf-dac502259ad0.png

3.2 Comparison with sota

79003fac-6f37-11ed-8abf-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2670

    浏览量

    47338
  • 检测器
    +关注

    关注

    1

    文章

    860

    浏览量

    47651
  • 检测算法
    +关注

    关注

    0

    文章

    119

    浏览量

    25212

原文标题:WIDER FACE六项第一!阿里达摩院提出MogFace:人脸检测新工作 | CVPR 2022

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    亚马逊推新,阿里达摩退出,融资规模大幅下滑后量子计算还是好生意吗?

    发烧友网都进行了跟踪报道,其中本文将重点聚焦AI量子芯片——Trainium2。 同时,基于Trainium2芯片的发布,我们不仅会联想到数日前的新闻:阿里达摩裁撤量子实验室,实验室以及仪器设备均捐给浙大。那么两则新闻综合来看
    的头像 发表于 11-30 00:12 2987次阅读
    亚马逊推新,<b class='flag-5'>阿里</b><b class='flag-5'>达摩</b><b class='flag-5'>院</b>退出,融资规模大幅下滑后量子计算还是好生意吗?

    阿里达摩发布玄铁R908 CPU

    在杭州第四届RISC-V中国峰会上,阿里达摩再次展现技术实力,隆重推出了玄铁处理器家族的最新成员——R908 CPU。此次发布标志着玄铁系列在高端计算领域的全面升级,吸引了业界的广泛瞩目。
    的头像 发表于 08-23 16:27 922次阅读

    人脸检测模型有哪些

    人脸检测是计算机视觉领域的一个重要研究方向,它涉及到从图像或视频中检测出人脸的位置和大小。随着深度学习技术的发展,人脸检测模型的性能得到了显
    的头像 发表于 07-03 17:05 914次阅读

    人脸检测人脸识别的区别是什么

    人脸检测人脸识别是计算机视觉领域的两个重要技术,它们在许多应用场景中都有广泛的应用,如安全监控、身份验证、社交媒体等。尽管它们在某些方面有相似之处,但它们之间存在一些关键的区别。本文将详细介绍
    的头像 发表于 07-03 14:49 924次阅读

    阿里达摩提出“知识链”框架,降低大模型幻觉

    近日,阿里巴巴达摩(湖畔实验室)携手新加坡南洋理工大学等研究机构,共同推出了大模型知识链(CoK)框架。该框架不仅可实时检索异构知识源,还能逐步纠正推理错误,有效提高了大模型在回答知识型问题时的准确率,并显著降低了所谓的“幻觉
    的头像 发表于 05-10 11:46 658次阅读

    润开鸿荣膺达摩“玄铁优选伙伴”奖

    江苏润和软件股份有限公司的控股子公司润开鸿数字科技有限公司,在近期阿里巴巴达摩玄铁团队主办的2024玄铁RISC-V生态大会上,荣获了备受瞩目的“玄铁优选伙伴”奖。这一荣誉是对润开鸿在推动RISC-V生态发展方面所做出的杰出贡
    的头像 发表于 03-21 10:41 1292次阅读

    玄铁RISC-V生态大会深圳召开,达摩引领RISC-V创新应用

    达摩院长张建锋在玄铁RISC-V生态大会上致词,RISC即将迎来蝶变进入应用爆发期   从2018年起,阿里巴巴开始投入RISC-V架构,是国内最早涉足RISC-V的技术团队之一。2019年玄铁C910处理器推出,成为全球R
    的头像 发表于 03-19 10:02 4357次阅读
    玄铁RISC-V生态大会深圳召开,<b class='flag-5'>达摩</b><b class='flag-5'>院</b>引领RISC-V创新应用

    达摩牵头成立“无剑联盟”,探索RISC-V产业合作新范式

    3月14日,由达摩举办的2024玄铁RISC-V生态大会在深圳举行,来自Arteris、新思科技(Synopsys)、Imagination、中国科学院软件研究所、中国电信研究等全球数百家企业
    发表于 03-14 16:56 324次阅读
    <b class='flag-5'>达摩</b><b class='flag-5'>院</b>牵头成立“无剑联盟”,探索RISC-V产业合作新范式

    阿里达摩北京公司新增AI业务

    阿里巴巴达摩(北京)科技有限公司近日进行了工商变更,经营范围有所调整。具体来说,公司去除了智联网、芯片技术、量子计算等数据通信、电子产品、软件和硬件技术及产品的研究、开发等业务,而新增了人工智能应用软件开发、人工智能基础软件开
    的头像 发表于 02-23 11:39 992次阅读

    阿里达摩在上海成立新公司,聚焦人工智能与软件开发

    天眼查信息显示,达摩(上海)科技有限公司已正式成立,法定代表人为张建锋,注册资本为1000万人民币。该公司由阿里巴巴旗下阿里巴巴达摩
    的头像 发表于 02-04 10:52 953次阅读

    【飞腾派4G版免费试用】飞腾派SeetafaceEngine人脸检测

    收到个飞腾派,周末有空玩玩。。。 Seetaface是2016年中科老师开源的的人脸识别引擎。https://github.com/seetaface/SeetaFaceEngine 源码
    发表于 12-18 10:53

    阿里达摩裁撤量子实验室,将所有仪器设备都捐给浙大

    时长、门操控、量子纠错,量子计算控制架构等领域,达摩取得了多个重要成果,包括高精度、多比特超导量子芯片,量子电路经典模拟器“太章”等。
    的头像 发表于 12-06 16:59 1856次阅读

    阿里达摩裁撤量子实验室证实!

    阿里达摩证实,他们已经决定裁撤量子实验室,并将实验室及仪器设备捐赠给浙江大学。这一举措的目的是为了促进量子科技的协同发展,并将捐赠的实验室和设备开放给浙江大学及其他高校和科研机构使用。
    的头像 发表于 11-28 18:20 1079次阅读

    阿里达摩量子实验室裁撤 整体捐献给浙江大学

    日前,阿里达摩量子实验室裁撤,达摩量子实验室以及仪器设备全部被捐给浙江大学。相关信息从首席科学家施尧耘发布的动态可以印证;这可以说是来自
    的头像 发表于 11-28 16:04 603次阅读

    阿里新处理器三连发:提速多达15倍

    阿里巴巴达摩宣布,推出三款基于RISC-V开放架构的平头哥玄铁系列处理器,分别是玄铁C920、玄铁C907、玄铁R910。
    的头像 发表于 11-25 14:41 1352次阅读
    <b class='flag-5'>阿里</b>新处理器三连发:提速多达15倍