0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过Logit调整的长尾学习

倩倩 来源:GiantPandaCV 作者:GiantPandaCV 2022-09-05 14:28 次阅读

1. 论文信息

标题:Long-Tail Learning via Logit Adjustment

作者:Aditya Krishna Menon, Sadeep Jayasumana, Ankit Singh Rawat, Himanshu Jain, Andreas Veit, Sanjiv Kumar (Google Research)

原文链接:https://arxiv.org/abs/2007.07314

代码链接:https://github.com/google-research/google-research/tree/master/logit_adjustment

2. 介绍

在传统的分类和识别任务中,训练数据的分布往往都受到了人工的均衡,即不同类别的样本数量无明显差异,如最有影响力的ImageNet,每种类别的样本数量就保持在1300张左右。

aece2de2-2cd9-11ed-ba43-dac502259ad0.jpg

在实际的视觉相关任务中,数据都存在如上图所示的长尾分布,少量类别占据了绝大多少样本,如图中Head部分,大量的类别仅有少量的样本,如图中Tail部分。解决长尾问题的方案一般分为4种:

重采样 (Re-sampling):采样过程中采样不同的策略,如对tail中的类别样本进行过采样,或者对head类别样本进行欠采样。

重加权 (Re-weighting):在训练过程中给与每种样本不同的权重,对tail类别loss设置更大的权重,这样有限样本数量。

新的学习策略 (Learning strategy):有专门为解决少样本问题涉及的学习方法可以借鉴,如:meta-learning、transfer learning。另外,还可以调整训练策略,将训练过程分为两步:第一步不区分head样本和tail样本,对模型正常训练;第二步,设置小的学习率,对第一步的模型使用各种样本平衡的策略进行finetune。

其实就笔者喜欢的风格而言,我对重加权这一方向的工作更为喜欢,因为通过各种统计学上的结论,来设计很好的loss改进来解决长尾/不均衡分布问题,我喜欢这类研究的原因是,他们(大部分)实现简单,往往只需几行代码修改下loss,就可以取得非常有竞争力的结果,因为简单所以很容易运用到一些复杂的任务中。

而从“奥卡姆剃刀”来看,我觉得各种迁移模型的理念虽然非常好,从头部常见类中学习通用知识,然后迁移到尾部少样本类别中,但是往往会需要设计复杂的模块,有增加参数实现过拟合的嫌疑,我认为这其实是把简单问题复杂化。我觉得从统计方面来设计更加优美,因此本文来介绍一篇我非常喜欢的从统计角度出发的工作。这篇论文来自Google Research,他们提供了一种logit的调整方法来应对长尾分布的问题。由于研究风格更偏向 machine learning, 所以论文风格更偏向统计类。

本文首先总结了对于logit的调整方法:

聚焦于测试阶段:对学习完的logit输出进行处理(post-hoc normalization),根据一些先验假设进行调整。

聚焦于训练阶段:在学习中调整loss函数,相对平衡数据集来说,调整优化的方向。

aeddeafc-2cd9-11ed-ba43-dac502259ad0.png

如上图,这两种方法都有许多较为优秀的工作,但是文中描述了这两种方法的几种限制:

weight normalization非常依赖于weight的模长会因为class的data数量稀少而变小,然而这种假设非常依赖于优化器的选择

直接修改loss进行重加权,也会影响模型的表征学习,从而导致优化过程不稳定,同时模型可能对尾部类过拟合,伤害了模型表征学习能力。

论文的motivation就是克服这些缺点,让不同类(head and tail classed)之间的logit能有一个相对较大的margin,设以一个consistent的loss,来让模型的性能更好。

3. 问题设定和过往方法回顾

3.1 Problem Settings

论文先从统计学的角度定义了一下这个problem settings,其实就是训练一个映射,让这个scorer的误分类损失最小:

但是类别不平衡的学习的setting导致P(y)分布是存在高度地skewed,使得许多尾部类别标签出现的概率很低。在这里,错误分类的比例就不是一个合适的metric: 因为模型似乎把所有的尾部类别都分类成头部类别也更够取得比较好的效果。所为了解决这个问题,一个自然的选择是平衡误差,平均每个类的错误率,从而让测试计算出的metric不是有偏的。

论文总结出了一个比较general的loss形式:

这里 是类别 yy 的权重;是另一个超参, 用来控制 margin 的大小。

3.2Post-hoc weight normalization

由于头部类别多,容易过拟合,自然会对头部类别overconfidence,所以我们需要通过一定的映射来调整logit。具体到调整的策略,自然是让大类置信度低一点,小类置信度高一点。

for , where and . Intuitively, either choice of upweights the contribution of rare labels through weight normalisation. The choice is motivated by the observations that tends to correlate with . Further to the above, one may enforce during training.

这里引用了一些其他做long-tail learning的论文,可以参考以便更好地对这一块进行理解。

3.3 Loss modification

至于对于loss的修改,就是很直接了在前面加一个权重,对于的取值,自然就是各个工作重点关注和改进的地方。

af02f478-2cd9-11ed-ba43-dac502259ad0.png

论文给予原有的各种方法各种比较全面的总结。

4. 方法

首先进行Post-hoc logit adjustment:

其实等号左边就是一个根据类别的样本数进行re-weighting。但是为了在exp的线性变换加上temperature时候不影响排序问题,所以把等号右边变成上式,通过这种方式放缩不会导致原本的排序出现问题。从而使得重加权仍能够给尾部类更高的权重。

af2dc766-2cd9-11ed-ba43-dac502259ad0.png

把loss改写成易于理解的方式就如下:

下面这个更为直接的loss被成为为pairwise margin loss,它可以把 y 与 y' 之间的margin拉大。

然后就是实现结合:

af47e862-2cd9-11ed-ba43-dac502259ad0.png

通过一些特殊的取值和另外的trick,可以实现两者的结合。

5. 实验结果

af5f3152-2cd9-11ed-ba43-dac502259ad0.png

这张图非常有意思,可以看出两个设计理念非常有效果。

af842f0c-2cd9-11ed-ba43-dac502259ad0.png

afa47d2a-2cd9-11ed-ba43-dac502259ad0.png

可以发现该方法在头部类和尾部类的性能都有所提升。

6. 结论

摘要:这篇写得很好的论文重新审视了logit调整的想法,以解决长尾问题。本文首先建立了一个统计框架,并以此为基础提出了两种有效实现对数平差的方法。他们通过在合成和自然长尾数据集上使用几个相关基线对其进行测试,进一步证明了这种方法的潜力。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 线性
    +关注

    关注

    0

    文章

    199

    浏览量

    25176
  • 模型
    +关注

    关注

    1

    文章

    3280

    浏览量

    48985
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24760
收藏 人收藏

    评论

    相关推荐

    什么是机器学习通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的机器学习的定义是“利用经
    的头像 发表于 11-16 01:07 467次阅读
    什么是机器<b class='flag-5'>学习</b>?<b class='flag-5'>通过</b>机器<b class='flag-5'>学习</b>方法能解决哪些问题?

    tlv320aic3104通过调整增益来控制声音大小,调整一下就出现一声“嘣“,如何解决?

    我们使用3104通过调整增益来控制声音大小。调整一下就出现一声“嘣“。请问这个该如何解决? 调整的寄存器如下: void VOLUME_TLV320(uint8_t volume
    发表于 10-30 06:06

    什么是交叉调整率?怎么改善?

    生活中多路输出电源应用广泛,但是多路输出电源的交叉调整率是个头疼的问题。今天,我们就来讨论一下交叉调整率的改善之道!
    的头像 发表于 10-24 11:15 754次阅读
    什么是交叉<b class='flag-5'>调整</b>率?怎么改善?

    如何调整TAS5729的BQ参数?

    各位工程师,我们公司采用TAS5729功放来驱动我们产品的喇叭,由于音腔的设计以及喇叭本身的频率响应问题,喇叭在3K~5K范围内失真比较大,我们准备通过调整TAS5729的Biquad来调整EQ
    发表于 10-15 08:30

    直流电机通过调整什么改变转速

    直流电机是一种常见的电机类型,广泛应用于各种工业和民用领域。直流电机的转速可以通过多种方式进行调整,以满足不同的应用需求。 直流电机的工作原理 直流电机主要由定子、转子、换向器和电刷等部分组成。其
    的头像 发表于 08-23 15:44 753次阅读

    Linux操作系统运行参数自动调整技术

    Linux操作系统运行参数的自动调整是一个复杂而关键的技术,它可以显著提高系统性能、稳定性和资源利用率。通过使用自适应算法特别是内核态的机器学习框架、性能监控工具和配置管理工具,能够在动态变化的工作
    的头像 发表于 08-22 09:53 335次阅读
    Linux操作系统运行参数自动<b class='flag-5'>调整</b>技术

    动态调整电源芯片输出电压

    这个是前阵子红外触摸框上的部分电路图, 主要功能是通过调整LDO输出电压间接控制发射灯的输出功率。
    的头像 发表于 07-17 11:44 1107次阅读
    动态<b class='flag-5'>调整</b>电源芯片输出电压

    BP神经网络的学习机制

    BP神经网络(Backpropagation Neural Network),即反向传播神经网络,是一种基于梯度下降算法的多层前馈神经网络,其学习机制的核心在于通过反向传播算法
    的头像 发表于 07-10 15:49 681次阅读

    深度学习模型训练过程详解

    深度学习模型训练是一个复杂且关键的过程,它涉及大量的数据、计算资源和精心设计的算法。训练一个深度学习模型,本质上是通过优化算法调整模型参数,使模型能够更好地拟合数据,提高预测或分类的准
    的头像 发表于 07-01 16:13 1411次阅读

    调速电机的速度调整范围有哪些

    的速度调整范围及其影响因素。 一、调速电机的分类 调速电机主要分为以下几类: 直流调速电机:通过改变电枢电压或电枢电阻来调整转速。 交流调速电机:通过改变电源频率、电压或相位来
    的头像 发表于 06-05 11:09 1836次阅读

    通过强化学习策略进行特征选择

    更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。在本文中,我们将介绍并实现一种新的通过强化学习策略的特征选择。我们先讨论强化学习,尤其是马尔可夫决策
    的头像 发表于 06-05 08:27 387次阅读
    <b class='flag-5'>通过强化学习</b>策略进行特征选择

    浅析 KV 存储之长尾时延问题,探寻行业更优解决方案!

    、主从同步等操作时,为不影响主线程,采用 fork 创建子线程去执行,但由于主线程仍在提供服务,触发 Copy-On-Write 时会引起性能抖动,导致长尾时延。 华为云 GeminiDB(原华为云
    的头像 发表于 04-08 18:28 1313次阅读
    浅析 KV 存储之<b class='flag-5'>长尾</b>时延问题,探寻行业更优解决方案!

    机器学习8大调参技巧

    今天给大家一篇关于机器学习调参技巧的文章。超参数调优是机器学习例程中的基本步骤之一。该方法也称为超参数优化,需要搜索超参数的最佳配置以实现最佳性能。机器学习算法需要用户定义的输入来实现准确性和通用性之间的平衡。这个过程称为超参数
    的头像 发表于 03-23 08:26 657次阅读
    机器<b class='flag-5'>学习</b>8大调参技巧

    led驱动电源如何调整电流大小的方法

    和功率有非常重要的作用。下面将详细介绍LED驱动电源如何调整电流大小的方法。 一、常见的LED驱动电源类型 线性驱动电源(Linear Driver): 线性驱动电源是一种基于线性稳压器原理的电源。在线性稳压器电路中,通过调整
    的头像 发表于 02-27 17:50 7079次阅读

    如何通过调整PIN LIN上的PWM占空比来控制电机速度吗?

    有人知道如何通过调整 PIN LIN 上的 PWM 占空比来控制电机速度吗?
    发表于 01-26 07:11