0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何提高事件检测(ED)模型的鲁棒性和泛化能力?

深度学习自然语言处理 来源:深度学习的知识小屋 作者:深度学习的知识小 2020-12-31 10:21 次阅读

论文中指出,以往关于ED的工作都是考虑如何提升模型的性能,而较少考虑模型的鲁棒性和泛化能力,作者将模型的鲁棒性和泛化能力定义为如下三条,并通过设计模型进行研究:

抗攻击性能:当训练数据中被加入扰动,会如何影响模型性能;

新类型的预测:模型能否预测出训练集中未见过的事件类型;

事件类型的模糊性: 根据统计,70%的事件触发词能够触发不同类型的事件,如何正确识别出这些模糊性触发词在各自上下文中所触发的具体事件类型。

基于以上问题,作者提出一种新的学习方式,主要包括一下两部分:

Contextselective discriminative learning: 根据句子内部的不同words的重要性得到trigger的上下文表示,目标是基于trigger的上下文表示预测句子中被mask的trigger的事件类型。

Contextualized similarity learning:基于"相同类型的事件触发词应当具有相似上下文"的假设,以mask-contraining的句子对为输入,如何输入中的两个句子表达的是同一事件类型,则训练目标是使他们的masked triggers具有语义相近的上下文表示。

作者分别将本文的模型与以往的SOTA模型进行了对比实验,证明了本文模型能较好地应对对抗攻击、未知类型预测和事件模糊性区分的问题。

原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3253

    浏览量

    48874
  • 深度学习
    +关注

    关注

    73

    文章

    5504

    浏览量

    121217

原文标题:【每日一读】EMNLP2020:如何提高事件检测(ED)模型的鲁棒性和泛化能力?

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自动驾驶中常提的是个啥?

    持稳定的运行能力,这是自动驾驶实现从技术验证到实际落地的关键要求。然而,这一概念对大多数人来说可能较为抽象,其在自动驾驶中的具体表现、技术实现与挑战却充满了值得探讨的内容。 什么
    的头像 发表于 01-02 16:32 342次阅读
    自动驾驶中常提的<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>是个啥?

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    介绍了如何使用分类任务进行手写数字的分类。相信大家脑海中可能会产生如下疑问: 数据依赖强:分类模型的表现通常依赖于大量的标注数据进行训练。获取高质量、大规模的数据集既耗时又昂贵。
    发表于 12-19 14:33

    原理在控制系统中的应用

    在现代控制系统的设计和分析中,是一个核心概念。指的是系统在面对
    的头像 发表于 11-11 10:26 1218次阅读

    深度学习模型优化

    。异常值和噪声可能会误导模型的训练,导致模型在面对新数据时表现不佳。 数据标准/归一 :将数据转换到同一尺度上,有助于模型更好地学习数据
    的头像 发表于 11-11 10:25 280次阅读

    算法在数据处理中的应用

    一、算法的基本概念 算法是指在面对数据中的异常值、噪声和不确定性时,仍能保持稳定性能
    的头像 发表于 11-11 10:22 362次阅读

    分析方法及其应用

    (Robustness)是指系统或方法对于外部干扰、误差或变化的稳定性和适应能力。以下是对
    的头像 发表于 11-11 10:21 1418次阅读

    在机器学习中的重要

    在机器学习领域,模型是指模型在面对输入数据的扰动、异常值、噪声或对抗性攻击时,仍能保持性能的能力
    的头像 发表于 11-11 10:19 388次阅读

    如何提高系统的

    保持其核心功能的能力。一个的系统能够抵御故障,从错误中恢复,并在不确定的环境中保持稳定。 二、系统设计阶段的
    的头像 发表于 11-11 10:17 697次阅读

    人脸检测模型有哪些

    和姿态变化的较差。 HOG + SVM HOG(Histogram of Oriented Gradients)是一种
    的头像 发表于 07-03 17:05 1051次阅读

    【大规模语言模型:从理论到实践】- 阅读体验

    直观地解释和理解。这可能会影响模型的可解释和可信赖,特别是在需要高度可靠的场景中。 通过修改注意力机制的计算方式或引入新的架构来降低计算复杂度和内存消耗;通过引入正则
    发表于 06-07 14:44

    【大规模语言模型:从理论到实践】- 每日进步一点点

    的训练效率、稳定性和能力。以下是关于大模型训练归一的详细介绍: 一、归一的目的和重要
    发表于 05-31 19:54

    CYW43455如何设置ED(能量检测)的适应阈值吗?

    我想设置 ED(能量检测)的适应阈值吗? * 如何激活 ED
    发表于 05-31 07:08

    智能驾驶大模型:有望显著提升自动驾驶系统的性能和

    智能驾驶大模型是近年来人工智能领域和自动驾驶领域最为前沿的研究方向之一,它融合了深度学习、多模态融合、世界模型构建等多种技术,有望显著提升自动驾驶系统的性能和
    的头像 发表于 05-07 17:20 1610次阅读
    智能驾驶大<b class='flag-5'>模型</b>:有望显著提升自动驾驶系统的性能和<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>

    【大语言模型:原理与工程实践】大语言模型的预训练

    和多样。高质量数据能确保模型稳定收敛,而数据的多样则有助于模型学习广泛的通用能力,如文本生成、信息抽取、问答和编程等。此外,数据的多样
    发表于 05-07 17:10

    基于计算设计的超应变传感器,实现软体机器人的感知和自主

    柔性应变传感器对软体机器人的感知和自主至关重要。然而,它们的可变形体和动态驱动在预测传感器制造和长期方面带来了挑战。
    的头像 发表于 03-07 09:50 886次阅读
    基于计算设计的超<b class='flag-5'>鲁</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>应变传感器,实现软体机器人的感知和自主<b class='flag-5'>性</b>