0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于毒性样本敏感性的有效后门防御!

CVer 来源:CVer 作者:CVer 2022-12-05 14:09 次阅读

香港中文大学(深圳)和清华大学联合完成的后门防御工作被NeurIPS 2022接收为Spotlight论文。基于投毒的后门攻击对由不可信来源数据所训练的模型构成了严重威胁。给定一个后门模型,我们观察到,相较于干净样本,毒性样本的特征表示对数据变换更加敏感。这启发我们设计了一个简单的敏感性度量——“针对数据变换的特征一致性(FCT)”,并基于FCT设计了一个样本区分模块,用以区分不可信训练集中的毒性样本和干净样本。此外,基于上述模块,我们提出了两种有效的后门防御方法,分别适用于不同的防御场景。第一种方法用于从头训练出一个安全模型(in-training defense),涉及一个两阶段的安全训练模块。第二种方法用于移除后门模型中的后门(post-training defense),包含一个交替遗忘毒性样本和重新学习干净样本的后门移除模块。在3个基准数据集和8种后门攻击上的实验结果表明了我们方法相较于SOTA防御方法的优越性能。

648efe2c-745b-11ed-8abf-dac502259ad0.png

论文标题: Effective Backdoor Defense by Exploiting Sensitivity of Poisoned Samples

收录会议: NeurIPS 2022 (Spotlight)

论文链接: https://openreview.net/pdf?id=AsH-Tx2U0Ug

代码链接: https://github.com/SCLBD/Effective_backdoor_defense

1 问题背景

训练深度神经网络(DNNs)往往需要大量的训练数据,这些数据有时可能由不可信的第三方来源所提供。这些不可信的数据可能会对模型的训练带来严重的安全威胁。典型的威胁之一就是基于投毒的后门攻击,它可以通过投毒一小部分训练样本(即:给这部分样本的图像加上指定的触发器,并把它们的标签改为某个目标类别),来向模型中注入后门(即:在训练过程中,模型能够学到触发器和目标类别之间的映射)。一般地,一个后门模型可以很好地预测干净样本,并且能将任何带有触发器的毒性样本预测为目标类别。为了解决上述威胁,本文提出2个有效的后门防御方法,即使使用不可信来源的数据训练,我们仍能得到安全、干净的模型。

2 方法介绍

方法的总体框架如图所示:

64a9860c-745b-11ed-8abf-dac502259ad0.png

2.1 样本区分模块

我们观察到,在后门模型的特征空间中,带有触发器的毒性样本总是会汇聚到一起,如下图的红色实心点所示。这表示,即使毒性样本包含着不同的物体,这些物体所代表的信息都被后门模型所忽略了。换句话说,毒性样本的特征表示由触发器所主导,而不是物体。因此,我们猜测:这样的主导作用来源于后门模型对触发器的过拟合,这是因为在不同的毒性样本中,触发器比物体具备更少多样性。

为了验证这一猜测,我们尝试对干净和毒性样本分别进行相同的数据变换,如旋转。我们观察到,毒性样本的特征表示不再汇聚到一起,而是移动到各自的ground-truth类别中,如下图的红+所示。这表示,触发器的主导作用消失了,我们也证实了上述的猜测。此外,我们发现,虽然干净样本的特征表示也受到数据变换的影响,但是相较于毒性样本,这些影响小得多。这些观察给了我们启发:我们可以利用特征表示对数据变换的敏感性来区分干净和毒性样本。

64dab9ca-745b-11ed-8abf-dac502259ad0.png

接下来,我们设计了一个度量——针对图像变换的特征一致性(FCT),来描述这种敏感性。

如下图所示,我们发现,依据这个度量,干净与毒性样本的分布具有显著差异。其中,左图/右图对应被BadNets attack/Blend attack攻击后的数据集。

6506518e-745b-11ed-8abf-dac502259ad0.png

因此,基于FCT,我们可以建立一个样本区分模块(Sample-distinguishment module)。基本规则是选取FCT最大的一部分作为毒性样本,FCT最小的一部分作为干净样本。

2.2 安全训练模块

结合样本区分模块,我们设计了一个两阶段的安全训练模块two-stage secure training (ST) module,这2个模块共同组成防御方法D-ST,它适用于in-training defense的防御场景,即:给定一个毒性数据集,此方法可以从头训练出一个安全的(准确率高且不包含后门)的模型,且在整个训练过程中模型都不会被注入后门。

2.2.1 阶段一:用半监督对比学习(SS-CTL)来学习特征提取器

现有防御方法DBD使用对比学习(CTL)来学习特征提取器,在这一过程中,干净样本的标签所包含的有价值信息会流失。另一方面,研究表明,相较于CTL,有监督对比学习(S-CTL)可以学到表现更好的特征提取器。因此,考虑到样本区分模块可以鉴别干净样本,我们提出半监督对比学习(SS-CTL)来学习一个不包含后门的安全的特征提取器。SS-CTL的损失函数如下:

对于每个毒性样本和不确定样本,SS-CTL将促使它的2个数据增强版本靠近;对于每个干净样本,SS-CTL将促使所有同类干净样本的数据增强版本靠近。

2.2.1 阶段二:用混合交叉熵损失来学习分类器

给定训练好的安全特征提取器,我们设计了一个混合交叉熵函数来学习分类器,表示如下:

它能够从干净样本学习到正确映射的同时,防止后门注入分类器。

2.3 后门移除模块

结合样本区分模块,我们设计了一个后门移除模块backdoor removal (BR) module,这2个模块共同组成防御方法D-BR,它适用于post-training defense的防御场景,即给定一个毒性数据集,我们先使用标准监督训练得到一个准确率高且包含后门的模型,再利用此方法移除模型中的后门,从而得到一个安全的(准确率高且不包含后门)模型。特别地,后门移除模块本质上是一个交替学习算法,包含了2个交替的步骤,分别是遗忘与重新学习。

2.3.1 遗忘

这一步旨在通过遗忘从毒性样本中学到的知识来移除后门,损失函数如下:

2.3.3 重新学习

这一步旨在通过从干净样本中重新学习知识来维持模型的识别准确率,损失函数如下:

3 实验结果

3.1 D-ST的有效性

我们选取适用于安全训练防御范式的方法DBD来作为baseline。此外,我们设计2个baseline方法。Baseline1和baseline2分别用CTL和S-CTL来训练特征提取器,且都用标准交叉熵来训练分类器。表1表示我们的方法D-ST不仅能够得到较高的ACC,还能将平均ASR抑制为1.21%(在CIFAR-10数据集上,在CIFAR-100上则是0.05%)。

6537f450-745b-11ed-8abf-dac502259ad0.png

3.2 D-BR的有效性

我们选取5个适用于后门移除防御范式的SOTA方法来作为baselines。表2表示我们的方法D-BR不仅能够维持高ACC,还能将平均ASR由97.29%减小至0.31%(在CIFAR-10数据集上,在CIFAR-100上则是由99.77%减小至0.07%)。

65674160-745b-11ed-8abf-dac502259ad0.png

3.3 其它实验

除了上述的主体实验以外,我们做了大量的实验来说明:(1)单个SD模块的有效性,(2)单个BR模块的有效性,(3)单个ST模块的有效性,(4)在不同数据变换类型下方法的表现,(5)在不同干净/毒性样本选择比例下方法的表现,(6)在不同投毒比例下方法的表现,(7)在不同模型结构及特征维度下方法的表现。更多的结果与分析请见原论文。

4 总结

在本文中,我们揭示了毒性样本对数据变换的敏感性,并提出了一个敏感性度量(FCT)。此外,我们提出了样本区分模块(SD module),安全训练模块(ST module)和后门移除模块(BR module)3个模块,它们构成了2种适用于不同防御范式的后门防御方法(D-ST, D-BR)。大量的实验分别证明了每个模块与整体方法的有效性。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2718

    浏览量

    47560
  • 神经网络
    +关注

    关注

    42

    文章

    4773

    浏览量

    100890
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24737

原文标题:NeurIPS 2022 | 一种基于毒性样本敏感性的有效后门防御!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    使用Phase Lab2024A计算合金抗裂敏感性

    · · 大家好,悄然间,Phase Lab2024A的新功能使用解析已接近尾声。本期我们奉上新版本最后个新功能的使用介绍——裂纹敏感性系数计算。 众所周知,由于成分、凝固方式和应力状态等多种
    的头像 发表于 12-04 11:35 196次阅读
    使用Phase Lab2024A计算合金抗裂<b class='flag-5'>敏感性</b>

    什么是湿度敏感等级 MSL (Moisture Sentivity levels)?

    MSL(MoistureSensitivityLevel)标准是电子行业用来评估元件对湿气敏感程度的套分类体系,它将元件根据其对湿气的敏感性分为8个不同的等级。这些等级反映了元件在特定温湿度条件下
    的头像 发表于 10-29 16:08 2110次阅读
    什么是湿度<b class='flag-5'>敏感</b>等级 MSL (Moisture Sentivity levels)?

    防御性编程:让系统坚不可摧

    Programming)正是为解决这问题而生的一种编程范式,它强调在编程过程中预见并防范潜在的错误和异常情况,从而增强软件的健壮性和稳定性。作为一种细致、谨慎的编程方法,通过提前考虑并防范可能出现的错误,从而
    的头像 发表于 07-25 14:04 294次阅读

    虹科干货 温度敏感性药品的安全守护秘籍

    和储存药品面临许多挑战。许多药物对温度变化敏感,因此需要仔细的存储和处理以保持其效力。在本文中,您将了解到温度敏感性药品安全运输与储存的解决方案。
    的头像 发表于 07-23 09:40 336次阅读
    虹科干货 温度<b class='flag-5'>敏感性</b>药品的安全守护秘籍

    点成干货 温度敏感性药品不同储运容器的温度监测方法

    本文主要介绍了温度敏感性药品的不同储运方式,以及为保障药品的储运安全,如何选择合适的储运方式和工具。
    的头像 发表于 07-19 10:48 321次阅读
    点成干货 温度<b class='flag-5'>敏感性</b>药品不同储运容器的温度监测方法

    温度敏感性药品不同储运容器的温度监测方法

    在上篇文章中,我们深入探讨了温度敏感性药品在运输和储存过程中面临的挑战,了解到温度的微小变化都可能对药品的化学结构和生物活性造成不可逆转的损害。在这篇文章中,我们将进步探讨药品不同储运容器的温度
    的头像 发表于 07-19 08:09 284次阅读
    温度<b class='flag-5'>敏感性</b>药品不同储运容器的温度监测方法

    点成干货 温度敏感性药品的安全守护秘籍

    许多药物对温度变化敏感,因此需要仔细的存储和处理以保持其效力。在本文中,您将了解到温度敏感性药品安全运输与储存的解决方案。
    的头像 发表于 07-16 11:10 378次阅读

    无人机主动防御系统不起作用吗

    起作用。无人机主动防御系统是一种用于保护无人机免受攻击的系统。这种系统可以有效地防止无人机被敌方攻击,提高无人机的生存能力。然而,无人机主动防御系统并不是万能的,它也存在
    的头像 发表于 07-08 09:57 546次阅读

    静电放电发生器的操控模式和释放模式有哪些

    静电放电(ESD)发生器是用于模拟静电放电事件的测试设备,它们用于测试电子设备对静电放电的敏感性和耐受性。
    的头像 发表于 05-19 16:51 1212次阅读

    一种集成低功耗pH传感器的离子敏感场效应晶体管(ISFET)

    据麦姆斯咨询报道,德国弗劳恩霍夫光子微系统研究所(Fraunhofer IPMS)开发出一种用于芯片式pH值测量的传感层,并成功将其集成到离子敏感场效应晶体管(ISFET)中。
    的头像 发表于 03-11 09:34 1283次阅读
    <b class='flag-5'>一种</b>集成低功耗pH传感器的离子<b class='flag-5'>敏感</b>场效应晶体管(ISFET)

    提高感性负载功率因数的方法是什么?

    感性负载功率因数成为了个重要的问题。本文将详细介绍提高感性负载功率因数的方法,包括电容补偿、直流磁场补偿、优化设计等方面。 、电容补偿 电容补偿是
    的头像 发表于 03-09 09:03 6809次阅读

    知语云智能科技无人机防御系统:应对新兴威胁的先锋力量

    随着科技的飞速发展,无人机技术在各个领域的应用日益广泛,但随之而来的是无人机威胁的不断升级。为了有效应对这些新兴威胁,知语云智能科技推出了先进的无人机防御系统,为空中安全保驾护航。 无人机防御系统
    发表于 02-26 16:35

    EMC设计中桥接的作用简析

    在电磁兼容性(**EMC)设计中,桥接是一种非常重要的技术手段。它主要用于解决电磁干扰(EMI)和电磁敏感性(EMS)问题,提高电子设备的可靠性和稳定性。
    的头像 发表于 02-17 14:59 1416次阅读
    EMC设计中桥接的作用简析

    常用的组合逻辑电路

    组合逻辑电路和时序逻辑电路是数字电路中两重要的逻辑电路类型,它们主要区别在于其输出信号的依赖关系和对时间的敏感性
    的头像 发表于 02-04 16:00 4608次阅读

    APP盾的防御机制及应用场景

    移动应用(APP)在我们日常生活中扮演着越来越重要的角色,但随之而来的是各种网络安全威胁的增加。为了保障APP的安全性,APP盾作为一种专门设计用于防御移动应用威胁的工具得以广泛应用。本文将深入探讨
    的头像 发表于 01-20 08:31 2095次阅读
    APP盾的<b class='flag-5'>防御</b>机制及应用场景