如何提高事件检测(ED)模型的鲁棒性和泛化能力？-电子发烧友网

论文中指出，以往关于ED的工作都是考虑如何提升模型的性能，而较少考虑模型的鲁棒性和泛化能力，作者将模型的鲁棒性和泛化能力定义为如下三条，并通过设计模型进行研究：

抗攻击性能:当训练数据中被加入扰动，会如何影响模型性能；

新类型的预测:模型能否预测出训练集中未见过的事件类型；

事件类型的模糊性: 根据统计，70%的事件触发词能够触发不同类型的事件，如何正确识别出这些模糊性触发词在各自上下文中所触发的具体事件类型。

基于以上问题，作者提出一种新的学习方式，主要包括一下两部分:

Contextselective discriminative learning: 根据句子内部的不同words的重要性得到trigger的上下文表示，目标是基于trigger的上下文表示预测句子中被mask的trigger的事件类型。

Contextualized similarity learning：基于"相同类型的事件触发词应当具有相似上下文"的假设，以mask-contraining的句子对为输入，如何输入中的两个句子表达的是同一事件类型，则训练目标是使他们的masked triggers具有语义相近的上下文表示。

作者分别将本文的模型与以往的SOTA模型进行了对比实验，证明了本文模型能较好地应对对抗攻击、未知类型预测和事件模糊性区分的问题。

原文标题：【每日一读】EMNLP2020：如何提高事件检测(ED)模型的鲁棒性和泛化能力？

文章出处：【微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3253

浏览量
48874
深度学习

深度学习

+关注

关注
73

文章
5504

浏览量
121217

原文标题：【每日一读】EMNLP2020：如何提高事件检测(ED)模型的鲁棒性和泛化能力？

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

自动驾驶中常提的鲁棒性是个啥？

持稳定的运行能力，这是自动驾驶实现从技术验证到实际落地的关键要求。然而，鲁棒性这一概念对大多数人来说可能较为抽象，其在自动驾驶中的具体表现、技术实现与挑战却充满了值得探讨的内容。什么

发表于 01-02 16:32 •342次阅读

自动驾驶中常提的<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>是个啥？

AI模型部署边缘设备的奇妙之旅：目标检测模型

介绍了如何使用分类任务进行手写数字的分类。相信大家脑海中可能会产生如下疑问：数据依赖性强：分类模型的表现通常依赖于大量的标注数据进行训练。获取高质量、大规模的数据集既耗时又昂贵。泛化

发表于 12-19 14:33

鲁棒性原理在控制系统中的应用

在现代控制系统的设计和分析中，鲁棒性是一个核心概念。鲁棒性指的是系统在面对

发表于 11-11 10:26 •1218次阅读

深度学习模型的鲁棒性优化

。异常值和噪声可能会误导模型的训练，导致模型在面对新数据时表现不佳。数据标准化/归一化：将数据转换到同一尺度上，有助于模型更好地学习数据

发表于 11-11 10:25 •280次阅读

鲁棒性算法在数据处理中的应用

一、鲁棒性算法的基本概念鲁棒性算法是指在面对数据中的异常值、噪声和不确定性时，仍能保持稳定性能

发表于 11-11 10:22 •362次阅读

鲁棒性分析方法及其应用

鲁棒性（Robustness）是指系统或方法对于外部干扰、误差或变化的稳定性和适应能力。以下是对鲁棒

发表于 11-11 10:21 •1418次阅读

鲁棒性在机器学习中的重要性

在机器学习领域，模型的鲁棒性是指模型在面对输入数据的扰动、异常值、噪声或对抗性攻击时，仍能保持性能的能力

发表于 11-11 10:19 •388次阅读

如何提高系统的鲁棒性

保持其核心功能的能力。一个鲁棒的系统能够抵御故障，从错误中恢复，并在不确定的环境中保持稳定。二、系统设计阶段的鲁棒

发表于 11-11 10:17 •697次阅读

人脸检测模型有哪些

和姿态变化的鲁棒性较差。 HOG + SVM HOG（Histogram of Oriented Gradients）是一种

发表于 07-03 17:05 •1051次阅读

【大规模语言模型：从理论到实践】- 阅读体验

直观地解释和理解。这可能会影响模型的可解释性和可信赖性，特别是在需要高度可靠性的场景中。通过修改注意力机制的计算方式或引入新的架构来降低计算复杂度和内存消耗；通过引入正则

发表于 06-07 14:44

【大规模语言模型：从理论到实践】- 每日进步一点点

的训练效率、稳定性和泛化能力。以下是关于大模型训练归一化的详细介绍：一、归一化的目的和重要

发表于 05-31 19:54

CYW43455如何设置ED（能量检测）的适应性阈值吗？

我想设置 ED（能量检测）的适应性阈值吗？ * 如何激活 ED？

发表于 05-31 07:08

智能驾驶大模型：有望显著提升自动驾驶系统的性能和鲁棒性

智能驾驶大模型是近年来人工智能领域和自动驾驶领域最为前沿的研究方向之一，它融合了深度学习、多模态融合、世界模型构建等多种技术，有望显著提升自动驾驶系统的性能和鲁棒

发表于 05-07 17:20 •1610次阅读

【大语言模型：原理与工程实践】大语言模型的预训练

和多样性。高质量数据能确保模型稳定收敛，而数据的多样性则有助于模型学习广泛的通用能力，如文本生成、信息抽取、问答和编程等。此外，数据的多样

发表于 05-07 17:10

基于计算设计的超鲁棒性应变传感器，实现软体机器人的感知和自主性

柔性应变传感器对软体机器人的感知和自主性至关重要。然而，它们的可变形体和动态驱动在预测传感器制造和长期鲁棒性方面带来了挑战。

发表于 03-07 09:50 •886次阅读

搜索历史

如何提高事件检测(ED)模型的鲁棒性和泛化能力？

评论

自动驾驶中常提的鲁棒性是个啥？

AI模型部署边缘设备的奇妙之旅：目标检测模型

鲁棒性原理在控制系统中的应用

深度学习模型的鲁棒性优化

鲁棒性算法在数据处理中的应用

鲁棒性分析方法及其应用

鲁棒性在机器学习中的重要性

如何提高系统的鲁棒性

人脸检测模型有哪些

【大规模语言模型：从理论到实践】- 阅读体验

【大规模语言模型：从理论到实践】- 每日进步一点点

CYW43455如何设置ED（能量检测）的适应性阈值吗？

智能驾驶大模型：有望显著提升自动驾驶系统的性能和鲁棒性

【大语言模型：原理与工程实践】大语言模型的预训练

基于计算设计的超鲁棒性应变传感器，实现软体机器人的感知和自主性