0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于有效样本的类别不平衡损失

自然语言处理爱好者 来源:AI公园 作者:Sik-Ho Tsang 2021-08-16 11:14 次阅读

导读

使用每个类的有效样本数量来重新为每个类的Loss分配权重,效果优于RetinaNet中的Focal Loss。

本文综述了康奈尔大学、康奈尔科技、谷歌Brain和Alphabet公司的基于有效样本数的类平衡损失(CB损失)。在本文中,设计了一种重新加权的方案,利用每个类的有效样本数来重新平衡损失,称为类别平衡损失。

1. 类别平衡问题

假设有像上面那样的不平衡的类。head:对于索引小的类,这些类有较多的样本。Tail:对于大索引的类,这些类的样本数量较少。黑色实线:直接在这些样本上训练的模型偏向于优势类。红色虚线:通过反向类频率来重新加权损失可能会在具有高类不平衡的真实数据上产生较差的性能。蓝虚线:设计了一个类平衡项,通过反向有效样本数来重新加权损失。

2. 有效样本数量

2.1. 定义

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

数据间信息重叠,左:特征空间S,中:1个样本数据的单位体积,右:数据间信息重叠

直觉上,数据越多越好。但是,由于数据之间存在信息重叠,随着样本数量的增加,模型从数据中提取的边际效益会减少

左:给定一个类,将该类的特征空间中所有可能数据的集合表示为S。假设S的体积为N且N≥1。中:S子集中的每个样本的单位体积为1,可能与其他样本重叠。Right:从S中随机抽取每个子集,覆盖整个S集合。采样的数据越多,S的覆盖率就越好。期望的采样数据总量随着样本数量的增加而增加,以N为界。

因此,将有效样本数定义为样本的期望体积。

这个想法是通过使用一个类的更多数据点来捕捉边际效益的递减。由于现实世界数据之间的内在相似性,随着样本数量的增加,新添加的样本极有可能是现有样本的近重复。另外,cnn是用大量的数据增广来训练的,所有的增广实例也被认为与原始实例相同。对于一个类,N可以看作是唯一原型的数量。

2.2. 数学公式

En表示样本的有效数量(期望体积)。为了简化问题,不考虑部分重叠的情况。也就是说,一个新采样的数据点只能以两种方式与之前的采样数据交互:完全在之前的采样数据集中,概率为p,或完全在原来的数据集之外,的概率为1- p。

有效数字:En = (1−β^n)/(1−β),其中,β = (N− 1)/N,这个命题可以用数学归纳法证明。当E1 = 1时,不存在重叠,E1 =(1−β^1)/(1−β) = 1成立。假设已经有n−1个样本,并且即将对第n个样本进行采样,现在先前采样数据的期望体积为En −1,而新采样的数据点与先前采样点重叠的概率为 p = E(n−1)/N。因此,第n个实例采样后的期望体积为:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此时:

我们有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命题表明有效样本数是n的指数函数。超参数β∈[0,1)控制En随着n的增长有多快。

3. 类别平衡 Loss (CB Loss)

类别平衡(CB)loss可以写成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是类别y的ground-truth的数量。β = 0对应没有重新加权, β → 1对应于用反向频率进行加权。

提出的有效样本数的新概念使我们能够使用一个超参数β来平滑地调整无重权和反向类频率重权之间的类平衡项。

所提出的类平衡项是模型不可知的和损失不可知的,因为它独立于损失函数L和预测类概率p的选择。

3.1. 类别平衡的 Softmax 交叉熵损失

给定一个标号为y的样本,该样本的softmax交叉熵(CE)损失记为:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假设类y有ny个训练样本,类平衡(CB)softmax交叉熵损失为:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 类别平衡的 Sigmoid 交叉熵损失

当对多类问题使用sigmoid函数时,网络的每个输出都执行一个one-vs-all分类,以预测目标类在其他类中的概率。在这种情况下,Sigmoid不假定类之间的互斥性。由于每个类都被认为是独立的,并且有自己的预测器,所以sigmoid将单标签分类和多标签预测统一起来。这是一个很好的属性,因为现实世界的数据通常有多个语义标签。sigmoid交叉熵(CE)损失可以写成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

类平衡(CB) sigmoid交叉熵损失为:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 类别平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以减少分类很好的样本的损失,聚焦于困难的样本。

类别平衡的 (CB) Focal Loss为:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 实验结果

4.1. 数据集

试验了CIFAR-10和CIFAR-100的5个不平衡系数分别为10、20、50、100和200的长尾版本。iNaturalist 和ILSVRC是天然的类别不平衡数据集。

上面显示了每个类具有不同不平衡因素的图像数量。

4.2. CIFAR 数据集

loss类型的超参数搜索空间为{softmax, sigmoid, focal}, [focal loss]的超参数搜索空间为β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致为0.9999。但在CIFAR-100上,不同不平衡因子的数据集往往有不同且较小的最优β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和没有类平衡项时的分类错误率

在CIFAR-10上,根据β = 0.9999重新加权后,有效样本数与样本数接近。这意味着CIFAR-10的最佳重权策略与逆类频率重权类似。在CIFAR-100上,使用较大的β的性能较差,这表明用逆类频率重新加权不是一个明智的选择,需要一个更小的β,具有更平滑的跨类权重。例如,一个特定鸟类物种的独特原型数量应该小于一个一般鸟类类的独特原型数量。由于CIFAR-100中的类比CIFAR-10更细粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大规模数据集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有数据集验证集上,使用不同损失函数训练的大规模数据集上的Top-1和Top-5分类错误率

使用了类平衡的Focal Loss,因为它具有更大的灵活性,并且发现β = 0.999和γ = 0.5在所有数据集上都获得了合理的良好的性能。值得注意的是,使用了类别平衡的Focal Loss来代替Softmax交叉熵,ResNet-50能够达到和ResNet-152相应的性能。

以上数字显示类平衡的Focal Loss损失经过60个epochs的训练后,开始显示其优势。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

编译:ronghuaiyang(AI公园)

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6141

    浏览量

    105091
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24641
  • cnn
    cnn
    +关注

    关注

    3

    文章

    351

    浏览量

    22168

原文标题:CB Loss:基于有效样本的类别不平衡损失

文章出处:【微信号:NLP_lover,微信公众号:自然语言处理爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电容器不平衡保护动作原因分析

    电容器不平衡保护动作的原因多种多样,主要包括以下几个方面: 1. 电容器组内部故障 电容量不平衡 :电容器组中的电容器由于老化、损坏或制造差异,可能导致三相电容量不平衡。当三相之间电容值差异较大
    的头像 发表于 09-20 15:43 686次阅读

    LCR测试仪如何测量不平衡度?

    在电路设计和维修中,了解电路元件的特性是非常重要的。LCR测试仪就是一种常用的检测仪器,它可以测量电感(L)、电容(C)和电阻(R)的参数。其中,测量不平衡度是LCR测试仪的一项重要功能。那么
    的头像 发表于 08-26 16:49 296次阅读
    LCR测试仪如何测量<b class='flag-5'>不平衡</b>度?

    三相电流不平衡对电压影响大吗

    在现代电力系统中,三相交流电是最常见的供电方式。三相电流平衡是保证电力系统稳定运行的关键因素之一。然而,由于多种原因,三相电流可能会出现不平衡现象,这对电力系统的电压稳定性和设备的正常运行
    的头像 发表于 07-25 16:28 948次阅读

    不平衡电流和零序电流的区别是什么

    在电力系统中,电流的平衡不平衡是影响电力系统稳定性和安全性的重要因素。不平衡电流和零序电流是两种常见的电流类型,它们在电力系统中扮演着不同的角色。 一、定义 不平衡电流 是指三相电力
    的头像 发表于 07-25 16:24 1032次阅读

    软启动三相不平衡的解决办法有哪些

    软启动三相不平衡是指在软启动过程中,三相电动机的电流不平衡,导致电动机的运行效率降低,甚至可能引发电动机的损坏。针对这个问题,我们可以从多个方面进行解决。 一、软启动三相不平衡的原因分析 电源电压
    的头像 发表于 07-02 09:40 2306次阅读

    软启动报三相电流不平衡怎么处理

    软启动器是一种用于电动机启动的电气设备,它可以有效地降低电动机启动时的电流冲击,减少对电网和电动机的影响。然而,在实际应用中,软启动器有时会出现三相电流不平衡的问题,这会对电动机的正常运行和软启动
    的头像 发表于 06-18 11:44 3960次阅读

    三相四线负荷不平衡影响计量吗为什么

    三相四线负荷不平衡是指三相电源接线不平衡导致三相电流不相等的情况。负荷不平衡会对电力计量产生一定的影响,包括电能计量的准确性以及电力系统的稳定性。下面将详细介绍三相四线负荷不平衡对计量
    的头像 发表于 03-29 15:50 2114次阅读

    三相不平衡调节装置 三相不平衡会造成什么后果

    三相不平衡调节装置是一种用于解决三相电力系统中三相电压或电流不平衡问题的设备。在本文中,我们将探讨三相不平衡的原因、后果和解决方案,并详细介绍三相不平衡调节装置的工作原理和应用。 引言
    的头像 发表于 02-06 10:14 1759次阅读

    三相不平衡最佳解决办法 三相不平衡多少范围内是合理的

    三相不平衡最佳解决办法 在电力系统中,三相不平衡是指三个相之间电压或电流不相等的现象。当三相不平衡的情况发生时,可能会导致线路过载、设备寿命缩短、电能损耗增加等问题。因此,解决三相不平衡
    的头像 发表于 02-06 10:07 2962次阅读

    三相电流不平衡是指什么?三相电流不平衡允许范围是多少

    三相电流不平衡是指什么?三相电流不平衡允许范围是多少  三相电流不平衡是指三相电路中三个相位电流的大小不相等或相位角不相等的情况。在理想的三相电路中,三个相位电流应当相等,相位角差120度。 然而
    的头像 发表于 02-02 17:34 7853次阅读

    电弧炉三相电流不平衡怎么办

    电弧炉是冶金行业中常用的设备之一,但是在使用过程中,可能会出现三相电流不平衡的问题。三相电流不平衡会影响电弧炉的工作效率,甚至可能导致设备的故障。那么,我们应该如何解决电弧炉三相电流不平衡的问题呢?
    的头像 发表于 12-29 14:08 941次阅读

    AD9288输出不平衡跟Vref有关系吗?

    最近在用AD9288作为采样芯片,发现很奇怪的问题,同样的信号幅度输入,两路AD采样数值不一样,一路基本平衡,另一路不平衡比较严重,采样值-91~+100;另一块同样的PCB板,两路都不平衡,比如
    发表于 12-15 06:24

    三相不平衡,如何判断与解决?

    三相不平衡,是电能质量的一个重要指标。其定义为:**在电力系统中三相电流(或电压)幅值不一致,且幅值差超过规定范围。
    的头像 发表于 12-13 15:45 1917次阅读
    三相<b class='flag-5'>不平衡</b>,如何判断与解决?

    三相电压不平衡对电路的影响

    对电路的影响主要包括以下几个方面: 1. 功率损失:在三相电压不平衡的情况下,电力系统中的三相负载也会出现不平衡,导致三相电流不平衡不平衡
    的头像 发表于 12-11 17:16 2418次阅读

    天线与馈线匹配中的平衡不平衡以及造成的影响解析

    天线与馈线匹配中的平衡不平衡以及造成的影响解析  天线与馈线的匹配是无线电通信中非常重要的一环。平衡不平衡是两种不同的天线与馈线匹配方式,它们对通信系统的性能有着不同的影响。 所谓
    的头像 发表于 11-28 14:28 1593次阅读