0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于有效样本的类别不平衡损失

自然语言处理爱好者 来源:AI公园 作者:Sik-Ho Tsang 2021-08-16 11:14 次阅读

导读

使用每个类的有效样本数量来重新为每个类的Loss分配权重,效果优于RetinaNet中的Focal Loss。

本文综述了康奈尔大学、康奈尔科技、谷歌Brain和Alphabet公司的基于有效样本数的类平衡损失(CB损失)。在本文中,设计了一种重新加权的方案,利用每个类的有效样本数来重新平衡损失,称为类别平衡损失。

1. 类别平衡问题

假设有像上面那样的不平衡的类。head:对于索引小的类,这些类有较多的样本。Tail:对于大索引的类,这些类的样本数量较少。黑色实线:直接在这些样本上训练的模型偏向于优势类。红色虚线:通过反向类频率来重新加权损失可能会在具有高类不平衡的真实数据上产生较差的性能。蓝虚线:设计了一个类平衡项,通过反向有效样本数来重新加权损失。

2. 有效样本数量

2.1. 定义

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

数据间信息重叠,左:特征空间S,中:1个样本数据的单位体积,右:数据间信息重叠

直觉上,数据越多越好。但是,由于数据之间存在信息重叠,随着样本数量的增加,模型从数据中提取的边际效益会减少

左:给定一个类,将该类的特征空间中所有可能数据的集合表示为S。假设S的体积为N且N≥1。中:S子集中的每个样本的单位体积为1,可能与其他样本重叠。Right:从S中随机抽取每个子集,覆盖整个S集合。采样的数据越多,S的覆盖率就越好。期望的采样数据总量随着样本数量的增加而增加,以N为界。

因此,将有效样本数定义为样本的期望体积。

这个想法是通过使用一个类的更多数据点来捕捉边际效益的递减。由于现实世界数据之间的内在相似性,随着样本数量的增加,新添加的样本极有可能是现有样本的近重复。另外,cnn是用大量的数据增广来训练的,所有的增广实例也被认为与原始实例相同。对于一个类,N可以看作是唯一原型的数量。

2.2. 数学公式

En表示样本的有效数量(期望体积)。为了简化问题,不考虑部分重叠的情况。也就是说,一个新采样的数据点只能以两种方式与之前的采样数据交互:完全在之前的采样数据集中,概率为p,或完全在原来的数据集之外,的概率为1- p。

有效数字:En = (1−β^n)/(1−β),其中,β = (N− 1)/N,这个命题可以用数学归纳法证明。当E1 = 1时,不存在重叠,E1 =(1−β^1)/(1−β) = 1成立。假设已经有n−1个样本,并且即将对第n个样本进行采样,现在先前采样数据的期望体积为En −1,而新采样的数据点与先前采样点重叠的概率为 p = E(n−1)/N。因此,第n个实例采样后的期望体积为:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此时:

我们有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命题表明有效样本数是n的指数函数。超参数β∈[0,1)控制En随着n的增长有多快。

3. 类别平衡 Loss (CB Loss)

类别平衡(CB)loss可以写成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是类别y的ground-truth的数量。β = 0对应没有重新加权, β → 1对应于用反向频率进行加权。

提出的有效样本数的新概念使我们能够使用一个超参数β来平滑地调整无重权和反向类频率重权之间的类平衡项。

所提出的类平衡项是模型不可知的和损失不可知的,因为它独立于损失函数L和预测类概率p的选择。

3.1. 类别平衡的 Softmax 交叉熵损失

给定一个标号为y的样本,该样本的softmax交叉熵(CE)损失记为:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假设类y有ny个训练样本,类平衡(CB)softmax交叉熵损失为:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 类别平衡的 Sigmoid 交叉熵损失

当对多类问题使用sigmoid函数时,网络的每个输出都执行一个one-vs-all分类,以预测目标类在其他类中的概率。在这种情况下,Sigmoid不假定类之间的互斥性。由于每个类都被认为是独立的,并且有自己的预测器,所以sigmoid将单标签分类和多标签预测统一起来。这是一个很好的属性,因为现实世界的数据通常有多个语义标签。sigmoid交叉熵(CE)损失可以写成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

类平衡(CB) sigmoid交叉熵损失为:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 类别平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以减少分类很好的样本的损失,聚焦于困难的样本。

类别平衡的 (CB) Focal Loss为:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 实验结果

4.1. 数据集

试验了CIFAR-10和CIFAR-100的5个不平衡系数分别为10、20、50、100和200的长尾版本。iNaturalist 和ILSVRC是天然的类别不平衡数据集。

上面显示了每个类具有不同不平衡因素的图像数量。

4.2. CIFAR 数据集

loss类型的超参数搜索空间为{softmax, sigmoid, focal}, [focal loss]的超参数搜索空间为β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致为0.9999。但在CIFAR-100上,不同不平衡因子的数据集往往有不同且较小的最优β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和没有类平衡项时的分类错误率

在CIFAR-10上,根据β = 0.9999重新加权后,有效样本数与样本数接近。这意味着CIFAR-10的最佳重权策略与逆类频率重权类似。在CIFAR-100上,使用较大的β的性能较差,这表明用逆类频率重新加权不是一个明智的选择,需要一个更小的β,具有更平滑的跨类权重。例如,一个特定鸟类物种的独特原型数量应该小于一个一般鸟类类的独特原型数量。由于CIFAR-100中的类比CIFAR-10更细粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大规模数据集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有数据集验证集上,使用不同损失函数训练的大规模数据集上的Top-1和Top-5分类错误率

使用了类平衡的Focal Loss,因为它具有更大的灵活性,并且发现β = 0.999和γ = 0.5在所有数据集上都获得了合理的良好的性能。值得注意的是,使用了类别平衡的Focal Loss来代替Softmax交叉熵,ResNet-50能够达到和ResNet-152相应的性能。

以上数字显示类平衡的Focal Loss损失经过60个epochs的训练后,开始显示其优势。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

编译:ronghuaiyang(AI公园)

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6173

    浏览量

    105652
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24744
  • cnn
    cnn
    +关注

    关注

    3

    文章

    353

    浏览量

    22256

原文标题:CB Loss:基于有效样本的类别不平衡损失

文章出处:【微信号:NLP_lover,微信公众号:自然语言处理爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电容器不平衡保护动作原因分析

    电容器不平衡保护动作的原因多种多样,主要包括以下几个方面: 1. 电容器组内部故障 电容量不平衡 :电容器组中的电容器由于老化、损坏或制造差异,可能导致三相电容量不平衡。当三相之间电容值差异较大
    的头像 发表于 09-20 15:43 1204次阅读

    LCR测试仪如何测量不平衡度?

    在电路设计和维修中,了解电路元件的特性是非常重要的。LCR测试仪就是一种常用的检测仪器,它可以测量电感(L)、电容(C)和电阻(R)的参数。其中,测量不平衡度是LCR测试仪的一项重要功能。那么
    的头像 发表于 08-26 16:49 514次阅读
    LCR测试仪如何测量<b class='flag-5'>不平衡</b>度?

    电容电压分配不平衡的影响

    电容电压分配不平衡(也称为电容器电压不均衡)在电力系统中可能会产生多种负面影响,具体包括以下几点: 1、过压导致的电容器损坏 电压不平衡会导致某些电容器承受过高的电压,超过其额定值。这种过压可能会
    的头像 发表于 08-09 14:15 820次阅读
    电容电压分配<b class='flag-5'>不平衡</b>的影响

    三相电流不平衡对电压影响大吗

    在现代电力系统中,三相交流电是最常见的供电方式。三相电流平衡是保证电力系统稳定运行的关键因素之一。然而,由于多种原因,三相电流可能会出现不平衡现象,这对电力系统的电压稳定性和设备的正常运行
    的头像 发表于 07-25 16:28 1312次阅读

    三相负载不平衡会引起零序电流吗

    会。三相负载不平衡是指在三相电力系统中,三个相的负载电流不相等。这种情况在实际应用中是比较常见的,比如在工业生产、民用建筑等场合。三相负载不平衡会引起一系列的问题,其中之一就是零序电流的产生。 一
    的头像 发表于 07-25 16:26 1389次阅读

    不平衡电流和零序电流的区别是什么

    在电力系统中,电流的平衡不平衡是影响电力系统稳定性和安全性的重要因素。不平衡电流和零序电流是两种常见的电流类型,它们在电力系统中扮演着不同的角色。 一、定义 不平衡电流 是指三相电力
    的头像 发表于 07-25 16:24 1369次阅读

    三相电流不平衡会产生零序电流吗

    会产生。在电力系统中,三相电流不平衡是一个常见的问题,它会导致许多不良后果,如设备过热、效率降低、电能损耗增加等。而零序电流则是电力系统中一种特殊的电流形式,它与三相电流不平衡有着密切的关系。 一
    的头像 发表于 07-25 16:22 1340次阅读

    软启动三相不平衡的解决办法有哪些

    软启动三相不平衡是指在软启动过程中,三相电动机的电流不平衡,导致电动机的运行效率降低,甚至可能引发电动机的损坏。针对这个问题,我们可以从多个方面进行解决。 一、软启动三相不平衡的原因分析 电源电压
    的头像 发表于 07-02 09:40 2925次阅读

    软启动报三相电流不平衡怎么处理

    软启动器是一种用于电动机启动的电气设备,它可以有效地降低电动机启动时的电流冲击,减少对电网和电动机的影响。然而,在实际应用中,软启动器有时会出现三相电流不平衡的问题,这会对电动机的正常运行和软启动
    的头像 发表于 06-18 11:44 4649次阅读

    电弧炉三相电流不平衡对补偿设备的损害

    电弧炉三相电流不平衡可能对补偿设备造成以下几种损害: 1、过载:当电弧炉三相电流不平衡时,某一相的电流可能会比其他相大很多,导致该相的补偿设备承受过载。长时间的过载可能会损坏补偿设备或缩短其寿命
    的头像 发表于 06-04 14:25 479次阅读
    电弧炉三相电流<b class='flag-5'>不平衡</b>对补偿设备的损害

    三相四线负荷不平衡影响计量吗为什么

    三相四线负荷不平衡是指三相电源接线不平衡导致三相电流不相等的情况。负荷不平衡会对电力计量产生一定的影响,包括电能计量的准确性以及电力系统的稳定性。下面将详细介绍三相四线负荷不平衡对计量
    的头像 发表于 03-29 15:50 2500次阅读

    三相不平衡调节装置 三相不平衡会造成什么后果

    三相不平衡调节装置是一种用于解决三相电力系统中三相电压或电流不平衡问题的设备。在本文中,我们将探讨三相不平衡的原因、后果和解决方案,并详细介绍三相不平衡调节装置的工作原理和应用。 引言
    的头像 发表于 02-06 10:14 1958次阅读

    三相不平衡最佳解决办法 三相不平衡多少范围内是合理的

    三相不平衡最佳解决办法 在电力系统中,三相不平衡是指三个相之间电压或电流不相等的现象。当三相不平衡的情况发生时,可能会导致线路过载、设备寿命缩短、电能损耗增加等问题。因此,解决三相不平衡
    的头像 发表于 02-06 10:07 3398次阅读

    三相电流不平衡是指什么?三相电流不平衡允许范围是多少

    三相电流不平衡是指什么?三相电流不平衡允许范围是多少  三相电流不平衡是指三相电路中三个相位电流的大小不相等或相位角不相等的情况。在理想的三相电路中,三个相位电流应当相等,相位角差120度。 然而
    的头像 发表于 02-02 17:34 9135次阅读

    论述无功补偿在三相不平衡治理中的应用和重要性

    论述无功补偿在三相不平衡治理中的应用和重要性 三相不平衡是指三相电源中存在电压或电流的非对称性,这种非对称性会影响电力系统的稳定性和效率。无功补偿是一种提供无功电流或电压的技术手段,可以解决三相
    的头像 发表于 01-23 16:28 1612次阅读