0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

间隔校准算法Margin Calibration来了!

CVer 来源:王晋东不在家 作者:王晋东不在家 2022-11-07 14:32 次阅读

长尾视觉识别任务对神经网络如何处理头部(常见)和尾部(罕见)类之间的不平衡预测提出了巨大挑战。模型倾向于将尾部类分类为头部类。虽然现有的研究侧重于数据重采样和损失函数工程,但在本文中,我们采用了不同的视角:分类间隔。我们研究了间隔(margin)和预测分数(logit)之间的关系,并凭经验观察到「未校准的边距和预测分数呈正相关」。我们提出了一种「简单而有效的边距校准方法 (Margin Calibration,MARC) 来校准边距以获得更平衡的预测分数」,从而提升分类性能。我们通过对常见长尾基准(包括 CIFAR-LT、ImageNet-LT、Places-LT 和 iNaturalist-LT)的广泛实验来验证MARC。实验结果表明,我们的MARC方法在这些基准上取得了良好的结果。此外,「只需三行代码」就能实现MARC。我们希望这种简单的方法能够激发人们重新思考长尾视觉识别中未校准的边距与预测分数之间的关系。

文章已被机器学习会议ACML 2022录用,由东京工业大学、微软STCA、南京大学、及微软亚洲研究院共同完成,第一作者为东京工业大学王一栋同学。

论文:https://arxiv.org/abs/2112.07225

0975ee7a-5e5c-11ed-a3b6-dac502259ad0.png

间隔与预测分数的关系

在本文中,我们研究了「间隔(Margin)」和「预测分数 (logits)」之间的关系,这是主导长尾绩效的关键因素。

如下图所示,我们凭经验发现边距和预测分数与每个类的基数相关(一个类的基数即该类别拥有数据的数量)。具体来说,在校准之前,头类往往比尾类具有更大的边距和预测分数。因此,需要校准这种不平衡的边距以获得平衡的预测分数去避免未校准的边距对分类性能产生负面影响。

0996aa48-5e5c-11ed-a3b6-dac502259ad0.png

间隔校准方法MARC: Margin Calibration

我们提出一个简单的间隔校准方法「MARC (margin calibration)」来解决长尾问题。

具体而言,我们训练了一个简单的特定于类别的边距校准模型,其中原始边距固定, 和 是可学习参数

的推理公式如下,最终是由预测分数(logit=)除以线性分类器(Linear Classifier Head)的权重(Weight)的模()取得,其中为线性分类器的偏差(bias):

因此,校准后的预测分数为

其中是固定的原始预测分数。

此外,我们还对不同类进行加权操作,最终通过训练 和 来获得更平衡的预测分数。

核心算法:仅需三行代码

MARC可以被分类为决策边界(间隔)调整算法,其与之前的一些同类算法如Decouple (ICLR'20, 评论区提到的)和DisAlign等的区别如下:

09c3afde-5e5c-11ed-a3b6-dac502259ad0.png

MARC的核心算法如下图所示,核心部分如红框所示。「仅需三行代码」即可实现MARC:

09e9b7f6-5e5c-11ed-a3b6-dac502259ad0.png

实验

分类结果

实验表格如下。我们在众多被广泛使用的长尾分类图像数据集中进行了对比。从实验结果可以看出MARC相比于其他方法取得了良好的性能,并且MARC十分容易实现。

0a054958-5e5c-11ed-a3b6-dac502259ad0.png

0a35ef54-5e5c-11ed-a3b6-dac502259ad0.png


复杂度

下图是MARC和另一个决策边界调整算法Dis-Align的对比试验,可以发现MARC取得了更平衡的边距和预测分数。

0a65271a-5e5c-11ed-a3b6-dac502259ad0.png

总结

本文研究了长尾视觉识别问题。具体来说,我们发现头类往往比尾类具有更大的边距和预测分数。受此发现的启发,我们提出了一个只有 2K(K是类别数)可学习参数的边距校准函数,以获得长尾视觉识别中的平衡预测分数。尽管我们的方法实现起来非常简单,但大量实验表明,与以前的方法相比,MARC在不改变模型表示的情况下取得了有利的结果。我们希望我们对预测分数和边距的研究能够为模型表示和边距校准的联合优化提供经验。未来,我们的目标是发展一个统一的理论来更好地支持我们的算法设计,并将该算法应用于更多的长尾应用。

Reference

[1] 本文所介绍的论文:Wang et al. Margin calibration for long-tailed visual recognition. Asian Conference on Machine Learning (ACML) 2022.

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4595

    浏览量

    92571
  • 代码
    +关注

    关注

    30

    文章

    4733

    浏览量

    68294

原文标题:三行代码解决长尾不平衡类别分类!间隔校准算法Margin Calibration来了!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    信道间隔,入射光功率,传输距离对q值的影响

    信道间隔、入射光功率、传输距离对Q值(通常用于衡量信号质量的一个参数)的影响是显著的,下面分别进行说明: 一、信道间隔对Q值的影响 信道间隔是指两个相邻信道的标称载频的差值,用于防止信道间干扰。信道
    的头像 发表于 10-15 16:43 646次阅读

    网分校准件的校准内容是什么

    网络分析仪搭配校准件使用,可能是工程师们每天的日常。
    的头像 发表于 08-06 17:21 554次阅读
    网分<b class='flag-5'>校准</b>件的<b class='flag-5'>校准</b>内容是什么

    OPA189 phase margin相位裕度是AOL*β在0dB时的相位即80°,为什么不是180-80=100°呢?

    OPA189教科书上的定义:运放的相位裕度phase margin是指运算放大器环路增益AOL*β为0dB时的相位与180 ° 的差值。 但是,在TI的各种文档中,比如如下截图中,phase margin相位裕度是AOL*β在0dB时的相位即80°,为什么不是180-8
    发表于 08-06 06:39

    AD7705的校准流程遇到的几个疑问求解

    我想具体了解一下AD7705的校准流程。 我已经看过AD7705的手册以及AD7705 Calibration_CN的文档了,但是感觉还是有一些不清楚。 目前我使用STM32F101通过SPI访问
    发表于 07-24 06:59

    示波器为什么要校准 示波器如何校准

    示波器作为一种精密的电子测量设备,其校准是确保测量准确性和可靠性的重要步骤。
    的头像 发表于 05-31 14:44 1129次阅读

    stm8低速时钟校准的疑问求解

    stm8低速时钟校准问题 stm8L10x标准库例程里的这个时钟校准函数一直不理解,求详解啊,一直不理解例程里的低速时钟校准 函数如下: /** * @briefUpdate APR
    发表于 05-08 07:10

    Moku 时间间隔与频率分析仪介绍及典型应用案例演示

    时间间隔与频率分析仪是Moku设备上集成的第14个仪器功能,具备了时间间隔分析仪、事件计数器和频率分析仪等多种测量功能。其时间测量精度达到皮秒级(优于20psRMS)及亚皮秒的数字分辨率且存在无死区
    的头像 发表于 05-01 08:15 444次阅读
    Moku 时间<b class='flag-5'>间隔</b>与频率分析仪介绍及典型应用案例演示

    STM32U5开发板ADC校准超时怎么解决?

    使用的代码就是官方的例程,我把官方的Cubemx文件另存为另一个工程之后,重新生成代码(这样做是为了保证硬件配置是一致的)。调用HAL_ADCEx_Calibration_Start进行ADC校准的时候超时。同一个板子用例程就很快完成了
    发表于 03-18 07:36

    浅谈时间间隔计数器的定时器间隔测量功能

    与频率计数器一样,定时器计数器或间隔定时器也具有许多组成测试仪器的模块。它们与计数器中使用的非常相似,只需要重新配置即可提供间隔定时功能。
    的头像 发表于 02-08 07:32 1611次阅读

    电流探头校准装置由哪些部件组成?

    电流探头校准装置由哪些部件组成? 电流探头校准装置是一种用于校准电流探头的设备,主要用于保证电流测量的准确性和可靠性。它由多个部件组成,每个部件都起着不可或缺的作用。下面将详细介绍电流探头校准
    的头像 发表于 01-08 15:55 486次阅读

    怎样设计和验证TRL校准件以及TRL校准的具体过程

    怎样设计和验证TRL 校准件以及TRL 校准的具体过程
    发表于 12-14 09:40 0次下载

    DWDM的中心波长/间隔是怎样的?

    DWDM的中心波长/间隔是怎样的? DWDM(密集波分复用技术)是一种光纤通信技术,它能够在光纤中同时传输多个独立的光信号。其核心是将不同波长的光信号分在不同的频率上,从而提高光纤的使用效率。在传输
    的头像 发表于 12-07 09:23 1583次阅读

    SOCV/POCV下寄存器的hold margin问题分析

    我们都知道,在做hold time检查的时候,是需要从lib中读取reg的hold requirement time,或者说hold margin
    的头像 发表于 12-05 14:18 439次阅读

    隔离拓扑和通道间隔离设计挑战

    电子发烧友网站提供《隔离拓扑和通道间隔离设计挑战.pdf》资料免费下载
    发表于 11-27 09:24 0次下载
    隔离拓扑和通道<b class='flag-5'>间隔</b>离设计挑战

    c语言printf输出空格间隔

    C语言中,需要在printf输出中添加空格间隔可以通过多种方式实现。这个空格间隔可以用于对输出进行格式化使其更加易读、美观。在接下来的文章中,我将详细介绍如何使用空格来间隔输出以及如何控制输出的对齐
    的头像 发表于 11-24 09:56 6162次阅读