0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何用一种级联的并解决嵌套的实体的三元组抽取模型?

自然语言处理爱好者 来源:AIAS编程有道 2023-02-08 09:28 次阅读

前言

关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。这些任务也都可看成三元组抽取,即(subject,predicate,object)。常见的抽取范式包含:

基于pipeline的分布抽取方式,在已知两个实体subject和object,去预测predicate。

联合抽取方式,一个模型同时将subject,predicate和object抽取出来。

「现实的场景中还存在重叠关系情况,那么针对这种情况该如何解决呢?」ACL2020有一篇论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction[1]介绍了如何一种级联的并解决嵌套的实体的三元组(文中介绍的是关系抽取)抽取模型。下面我们来看看这篇论文介绍的内容。

背景

早期基于pipeline的方法首先识别出语句中的所有实体,然后在对所有的实体对分类。这种方式的一个缺点是:实体识别过程中的误差会被引入到关系抽取的环节中,如下图中的Normal情况。

现有的联合抽取模型中不能够有效地解决:一个句子包含多个相互重叠的关系三元组。如下图中的EPO和SEO。

前言

关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。这些任务也都可看成三元组抽取,即(subject,predicate,object)。常见的抽取范式包含:

基于pipeline的分布抽取方式,在已知两个实体subject和object,去预测predicate。

联合抽取方式,一个模型同时将subject,predicate和object抽取出来。

「现实的场景中还存在重叠关系情况,那么针对这种情况该如何解决呢?」,ACL2020有一篇论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction[1]介绍了如何一种级联的并解决嵌套的实体的三元组(文中介绍的是关系抽取)抽取模型。下面我们来看看这篇论文介绍的内容。

背景

早期基于pipeline的方法首先识别出语句中的所有实体,然后在对所有的实体对分类。这种方式的一个缺点是:实体识别过程中的误差会被引入到关系抽取的环节中,如下图中的Normal情况。

现有的联合抽取模型中不能够有效地解决:一个句子包含多个相互重叠的关系三元组。如下图中的EPO和SEO。

poYBAGPi-w2AJZ6AAAEnKUp7tzg862.jpg

EPO(Entity Pair Overlap)实体对的重叠,换句话说一个实体对包含多种关系,文中的例子就是一个人同时担任一部电影中的导演和演员的角色。

SEO(Single Entity Overlap)单个实体的重叠,就是有多个关系共享一个实体。

在2020年,预训练模型大行其道的时期下,文中也是结合了Bert模型完成文本的特征抽取工作。文中的模型在当时也达到了sota水平,下面我们看看模型的具体内容。

模型结构

关系三元组提取的目标是识别句子中所有可能的三元组(主语、关系、宾语),其中一些三元组可能与主语或宾语共享相同的实体。数学表达如下:
pYYBAGPi-z2AV6q0AAE7kBlmJ6c146.jpg
poYBAGPi-0WAfiwdAAHR72r561o641.jpg
pYYBAGPi-02AU1WiAAGqtlmaeF0972.jpg

具体如下:

BERT Encoder

编码器模块中,使用预训练Bert模型提取语句的特征为,作为接下来的tagging模块的输入。

Cascade Decoder

该模块主要分为两个部分,首先从输入的语句中监测出subjects,即Subject Tagger。接着对候选的subject,检查其可能的所有关系类型,即Relation-Specific Object Taggers

Subject Tagger

在这个模块中主要去识别输入语句中可能存在的subjects。每一个token会输出两个结果:start和end,通过为每个token分配一个二进制标记(0/1)来分别检测subject的开始和结束位置,该标记指示当前标记是否对应于subject的开始或结束位置。subject标记器对每个token的详细操作如下:

其中:

poYBAGPi-4SAdY1bAAHV6gAyWh4761.jpg
poYBAGPi-4yAJL5eAAHVFUr-aPY146.jpg
pYYBAGPi-5SANdB6AAFI8-CAJm4952.jpg

总结

实验效果如下图:
poYBAGPi-7GABYrMAAIcrLoLxoY399.jpg




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3641

    浏览量

    134470
  • SEO
    SEO
    +关注

    关注

    0

    文章

    48

    浏览量

    9916

原文标题:一种基于联合方式的三元组抽取模型——CasRel

文章出处:【微信号:NLP_lover,微信公众号:自然语言处理爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    乙烯装置三元制冷技术

    乙烯装置三元制冷技术摘 要 简介了三元制冷系统的设计思路和工艺流程,针对开车运行过程中出现的问题,总结了处理方法。关键词 乙烯 三元制冷 技术 在齐鲁乙烯720kt/ a 改造工程中,额外增加的全部
    发表于 03-18 22:14

    回收电芯,回收库存电芯,回收聚合物电芯,回收锂电芯,回收动力电芯三元电芯回收

    回收电芯,回收库存电芯,回收聚合物电芯,回收锂电芯,回收动力电芯三元电芯
    发表于 08-24 11:57

    根据mac地址创建五元组的步骤

    1. 确认wifi的mac地址根据实际情况得到开发板wifi的mac地址,通常通过命令iwpriv wifi_debug get_mac可知。2. 创建特定五元组在生活物联网平台,本文以mac地址为
    发表于 03-08 07:37

    一种基于策略元素三元组的策略描述语言

    分析常用策略描述语言的缺点,总结策略的主要配置方式,分析策略的组成成员,提出策略主要元素ECA三元组给出其关系,设计一种基于ECA的策略描述语言,阐述其相关的词法和
    发表于 04-09 09:22 19次下载

    一种基于结构的本体分解方法

    RDF 三元组构成的图模型是本体表示方法的一种,主体和客体对应图中的结点,谓词对应图中的边。本文首先通过查询获取本体的三元组表示,生成对应的图;然后对图做预处理,
    发表于 12-22 12:08 8次下载

    三元相图基础

    三元相图基础 三元相图与二相图的差别,在于增加了个成分变量。三元相图的基本特点为: (1)完整的
    发表于 08-06 14:21 9557次阅读

    基于句法语义依存分析的金融事件抽取

    是关注的重点.因此,本文聚焦于金融事件,抽取三元组事件ET(Sub,Pred,Obj).在中文财经新闻中,存在大量事件嵌套和成分共享等现象,致使易岀现事件漏抽和事件成分缺失的情况.为了解决这些冋题,本文建立句法和语义依存分析相结
    发表于 03-24 14:03 8次下载
    基于句法语义依存分析的金融事件<b class='flag-5'>抽取</b>

    一种改进的胶囊网络知识图谱补全方法

    为准确表征知识图谱中实体与关系属性的关系,提出一种改进的胶囊网络知识图谱补全方法。将表示多关系数据的三元组转换为矩阵的形式与多个过滤器进行卷积,产生不同特征图并重构为相应的胶囊,每个胶囊代表
    发表于 03-30 15:18 13次下载
    <b class='flag-5'>一种</b>改进的胶囊网络知识图谱补全方法

    融合实体信息的类别增强知识图谱表示学习模型

    注意力机制捕获实体类别和三元组关系之间的潜在相关性,结合不同实体类别对于某种特定关系的重要程度及实体类别信息进行知识表示学习。在知识图谱补全和三元组
    发表于 04-27 16:26 4次下载
    融合<b class='flag-5'>实体</b>信息的类别增强知识图谱表示学习<b class='flag-5'>模型</b>

    可提高跨模态行人重识别算法精度的特征学习框架

    为了提升跨模态行人重识别算法的识别精度,提出了一种基于改进困难三元组损失的特征学习框架。首先,改进了传统困难三元组损失,使其转换为全局三元组损失。其次,基于跨模态行亼重识别中存在模态间
    发表于 05-10 11:06 9次下载

    介绍一种新颖的三元组对比学习训练框架

    在自然语言处理和知识图谱领域的信息提取中,三元组抽取是必不可少的任务。
    的头像 发表于 06-23 15:56 3428次阅读
    介绍<b class='flag-5'>一种</b>新颖的<b class='flag-5'>三元组</b>对比学习训练框架

    本体自动化构建方法—面向制造领域人机物三元数据融合

    控制机制,提出一种基于本体的人机物三元数据融合方法,研究复杂制造环境下的人机物三元数据融合建模.在抽取三元组时,区别于传统的流水线式
    的头像 发表于 05-11 17:30 3320次阅读

    泰凌微电子三元组认证功能实现

    App扫描广播连接Device,Device主动上报三元组Confirm + Random(随机数),App将广播包里的Product_info + Mac_address上报云端查找三元组表格获取Secret,云端再通过AE
    的头像 发表于 11-23 10:24 1174次阅读

    三元锂电池的分类及应用

    三元锂电池,是指使用镍钴锰酸锂或镍钴铝酸锂三元正极材料制成的一种锂电池。三元材料分别指镍、钴和锰。
    的头像 发表于 07-04 09:23 3224次阅读

    三元锂电池参数 三元锂电池最佳工作温度 三元锂电池寿命般是几年?

    三元锂电池参数 三元锂电池最佳工作温度 三元锂电池寿命般是几年? 三元锂电池是一种常见的锂离子
    的头像 发表于 11-21 16:05 1.7w次阅读