0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何提高事件检测(ED)模型的鲁棒性和泛化能力?

深度学习自然语言处理 来源:深度学习的知识小屋 作者:深度学习的知识小 2020-12-31 10:21 次阅读

论文中指出,以往关于ED的工作都是考虑如何提升模型的性能,而较少考虑模型的鲁棒性和泛化能力,作者将模型的鲁棒性和泛化能力定义为如下三条,并通过设计模型进行研究:

抗攻击性能:当训练数据中被加入扰动,会如何影响模型性能;

新类型的预测:模型能否预测出训练集中未见过的事件类型;

事件类型的模糊性: 根据统计,70%的事件触发词能够触发不同类型的事件,如何正确识别出这些模糊性触发词在各自上下文中所触发的具体事件类型。

基于以上问题,作者提出一种新的学习方式,主要包括一下两部分:

Contextselective discriminative learning: 根据句子内部的不同words的重要性得到trigger的上下文表示,目标是基于trigger的上下文表示预测句子中被mask的trigger的事件类型。

Contextualized similarity learning:基于"相同类型的事件触发词应当具有相似上下文"的假设,以mask-contraining的句子对为输入,如何输入中的两个句子表达的是同一事件类型,则训练目标是使他们的masked triggers具有语义相近的上下文表示。

作者分别将本文的模型与以往的SOTA模型进行了对比实验,证明了本文模型能较好地应对对抗攻击、未知类型预测和事件模糊性区分的问题。

原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3172

    浏览量

    48713
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120977

原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    原理在控制系统中的应用

    在现代控制系统的设计和分析中,是一个核心概念。指的是系统在面对
    的头像 发表于 11-11 10:26 393次阅读

    深度学习模型优化

    。异常值和噪声可能会误导模型的训练,导致模型在面对新数据时表现不佳。 数据标准/归一 :将数据转换到同一尺度上,有助于模型更好地学习数据
    的头像 发表于 11-11 10:25 156次阅读

    算法在数据处理中的应用

    一、算法的基本概念 算法是指在面对数据中的异常值、噪声和不确定性时,仍能保持稳定性能
    的头像 发表于 11-11 10:22 178次阅读

    分析方法及其应用

    (Robustness)是指系统或方法对于外部干扰、误差或变化的稳定性和适应能力。以下是对
    的头像 发表于 11-11 10:21 280次阅读

    在机器学习中的重要

    在机器学习领域,模型是指模型在面对输入数据的扰动、异常值、噪声或对抗性攻击时,仍能保持性能的能力
    的头像 发表于 11-11 10:19 211次阅读

    如何提高系统的

    保持其核心功能的能力。一个的系统能够抵御故障,从错误中恢复,并在不确定的环境中保持稳定。 二、系统设计阶段的
    的头像 发表于 11-11 10:17 166次阅读

    人脸检测模型有哪些

    和姿态变化的较差。 HOG + SVM HOG(Histogram of Oriented Gradients)是一种
    的头像 发表于 07-03 17:05 917次阅读

    多叉指MOSFET器件静电防护提升技巧

    开启,无法达到预期ESD防护等级。本文从版图、器件结构、触发技术等角度介绍一些改善多叉指MOSFET静电防护器件电流泄放均匀提升器件静电防护的技巧。
    的头像 发表于 06-22 00:50 478次阅读
    多叉指MOSFET器件静电防护<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>提升技巧

    【大规模语言模型:从理论到实践】- 阅读体验

    直观地解释和理解。这可能会影响模型的可解释和可信赖,特别是在需要高度可靠的场景中。 通过修改注意力机制的计算方式或引入新的架构来降低计算复杂度和内存消耗;通过引入正则
    发表于 06-07 14:44

    【大规模语言模型:从理论到实践】- 每日进步一点点

    的训练效率、稳定性和能力。以下是关于大模型训练归一的详细介绍: 一、归一的目的和重要
    发表于 05-31 19:54

    CYW43455如何设置ED(能量检测)的适应阈值吗?

    我想设置 ED(能量检测)的适应阈值吗? * 如何激活 ED
    发表于 05-31 07:08

    智能驾驶大模型:有望显著提升自动驾驶系统的性能和

    智能驾驶大模型是近年来人工智能领域和自动驾驶领域最为前沿的研究方向之一,它融合了深度学习、多模态融合、世界模型构建等多种技术,有望显著提升自动驾驶系统的性能和
    的头像 发表于 05-07 17:20 1522次阅读
    智能驾驶大<b class='flag-5'>模型</b>:有望显著提升自动驾驶系统的性能和<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>

    【大语言模型:原理与工程实践】大语言模型的预训练

    和多样。高质量数据能确保模型稳定收敛,而数据的多样则有助于模型学习广泛的通用能力,如文本生成、信息抽取、问答和编程等。此外,数据的多样
    发表于 05-07 17:10

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    。 大语言模型的缩放定律对于深度学习研究和应用具有重要意义。它提供了更强大的能力和适应,使得模型
    发表于 05-04 23:55

    基于计算设计的超应变传感器,实现软体机器人的感知和自主

    柔性应变传感器对软体机器人的感知和自主至关重要。然而,它们的可变形体和动态驱动在预测传感器制造和长期方面带来了挑战。
    的头像 发表于 03-07 09:50 791次阅读
    基于计算设计的超<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>应变传感器,实现软体机器人的感知和自主<b class='flag-5'>性</b>