0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何统一各种信息抽取任务的输入和输出

深度学习自然语言处理 来源:圆圆的算法笔记 作者:圆圆的算法笔记 2022-09-20 15:25 次阅读

信息抽取任务包括命名实体识别(NER)、关系抽取(RE)、事件抽取(EE)等各种各样的任务。不同的信息抽取任务针对的任务不同,希望得到的输出也不同。例如下面的例子中,对于NER任务,需要识别Steve是PER、Apple是ORG;而对于关系抽取任务,则需要识别出Steve和Apple是Work For的关系。此外,不同场景的同一个信息抽取任务的输出可能也是不同的。

33d9fc38-37f1-11ed-ba43-dac502259ad0.png

目前业内比较常见的做法是针对每个场景的每种信息抽取任务,分别独立的训练一个模型。这种方法成本很高,每种任务、每种场景都要建立模型。此外,独立的训练模型导致不同任务之间无法共享知识,没有发挥出数据和模型的全部能力。

中科院、百度在ACL 2022中提出了一种可以实现统一建模各类信息抽取任务的框架UIE,在4种信息检索任务的13个数据集上都取得了显著效果。

1 统一多种信息抽取任务

要想实现使用一个模型解决多种信息抽取任务的目标,一个核心问题是如何统一各种信息抽取任务的输入和输出。作者提出所有信息抽取任务都可以抽象成SpottingAssociating两个步骤:在Spotting步骤中,确定输入文本中的实体以及该实体对应的实体类型;在Associating中,建立两个实体之间的关系。

例如下面是Steve became CEO of Apple in 1997这句话使用上述方法抽象出来的描述语言。蓝色的代表关系抽取,红色的代表事件抽取,其他的是命名实体识别。首先能够识别出person、organization、time三种实体。此外Steve可以识别出work for的关系,而事件以became作为start-position,关联employee、employer、time。

3403d364-37f1-11ed-ba43-dac502259ad0.png

通过上述方法,可以实现将所有信息抽取任务都抽象为相同结构的语言描述,为后续的多任务统一建模打下了基础。

2 基于prompt的多任务统一建模

基于上面的关系抽取统一描述,本文提出了UIE框架,在输入侧构造每个任务structural schema instructor (SSI),以及原始文本,使用Encoder编码后,使用Decoder解码统一的信息抽取语言描述。整个过程如下图所示。

3430638e-37f1-11ed-ba43-dac502259ad0.png

仍然以上面文本为例,输入由SSL原始文本组成。对于关系抽取任务,SSL对应的是[spot] person [asso] word for。这会作为一个前缀prompt,用来指导模型根据特定的任务进行文本生成。而对于NER任务,SSL对应的是[spot] person [spot] organization [spot] time。SSL后面接一个[text]标识符以及原来的文本。整体的输入文本拼接模式如下:

34525494-37f1-11ed-ba43-dac502259ad0.png

上述文本会通过Encoder进行编码,然后利用Decoder进行文本生成,生成的目标文本即为根据信息抽取的label生成的统一描述。在具体的模型结构上,BART、T5等生成式模型,都可以作为框架的主模型的backbone。这种基于前缀的生成方式,也可以比较容易的适应到一个新的信息抽取任务上。

3 模型训练

为了训练上面说的从SSL+文本到描述的生成式模型,文中采用了三个预训练任务联合学习。构造了3种数据,分别是SSL+原始文本到结构化文本的pair对、单独的原始文本以及单独的结构化文本。第一个任务是SSL+原始文本到结构化文本的匹配关系,匹配的label为1,不匹配label为0,label为0的样本是通过随机替换spot或associate实现的。第二个任务是使用结构化文本训练Decoder,这一步是为了让Decoder适应结构化文本的语言形式。第三个任务是在训练过程中引入一般的mask language modeling任务,目的是防止模型在训练过程中丢失了文本原始的语义信息。最终的预训练loss是下面3个loss的和:

3470d8d8-37f1-11ed-ba43-dac502259ad0.png

预训练好的模型可以在下游任务进行finetune以应用到各类任务上。同时作者引入rejection mechanism,在结构化文本中插入一些在原始输入中没有的实体以及NULL,让模型可以通过生成NULL避免被误导生成不正确的结果。

34b4b792-37f1-11ed-ba43-dac502259ad0.png

4 实验结果

UIE框架在信息抽取任务中的整体效果如下,主要对比了UIE和各个数据集上各类SOTA模型的效果。可以看到在大部分数据集上,UIE的效果都是最优的。对比没有经过预训练的模型(SEL),UIE取得非常显著的提升,通过将多任务使用统一框架联合训练,实现了知识的共享和效果的互相促进。

35247a28-37f1-11ed-ba43-dac502259ad0.png

除了在正常的有监督任务上效果外,本文也对小样本场景的效果进行了实验,主要对比了使用T5模型finetune和使用UIE方法的效果,UIE在小样本上的效果非常显著。

3560cc80-37f1-11ed-ba43-dac502259ad0.png

5 开源代码

与此论文相应的开源代码发布在百度PaddleNLP上https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/uie

35cc9ee2-37f1-11ed-ba43-dac502259ad0.png

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6986

    浏览量

    88931
  • 模型
    +关注

    关注

    1

    文章

    3217

    浏览量

    48801
  • NER
    NER
    +关注

    关注

    0

    文章

    7

    浏览量

    6209

原文标题:一个模型解决所有信息抽取任务!(含代码)

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    文本信息抽取的分阶段详细介绍

    文本信息抽取作为监督学习的项具体运用。文本信息抽取可以分为两个阶段:学习阶段和抽取阶段。其过程
    发表于 09-16 15:03

    基于子树广度的Web信息抽取

    提出种新的网页信息抽取方法,基于子树的广度可不加区分地对不同科技文献网站的页面信息进行自动抽取。对大量科技文献网站进行
    发表于 03-28 10:03 14次下载

    基于重复模式的自动Web信息抽取

    互联网上存在很多在线购物网站,抽取这类网站页面里的商品信息可以为电子商务、Web查询提供增值服务。该文针对这类网站提出种自动的Web信息抽取
    发表于 04-10 09:33 11次下载

    基于XML的WEB信息抽取模型设计

    对现有的信息抽取技术和XML 技术加以研究,在此基础上提出了适合XML 的通用的web 信息抽取模型,它能够把Web 上的数据抽取出来整合到
    发表于 12-22 13:56 17次下载

    基于WebHarvest的健康领域Web信息抽取方法

    针对Web信息抽取(WIE)技术在健康领域应用的问题,提出了种基于WebHarvest的健康领域Web信息抽取方法。通过对不同健康网站的结
    发表于 12-26 13:44 0次下载

    节点属性的海量Web信息抽取方法

    为解决大数据场景下从海量Web页面中抽取有价值的信息,提出了种基于节点属性与正文内容的海量Web信息抽取方法。将Web页面转化为DOM树表
    发表于 02-06 14:36 0次下载

    抽取式摘要方法中如何合理设置抽取单元?

    的核心问题。抽取式摘要则是文本摘要技术中效果稳定,实现简单的类方法,本文结合COLING 2020中抽取式摘要相关的两篇最新工作,对抽取式摘要方法中如何合理设置
    的头像 发表于 05-03 18:23 1622次阅读
    <b class='flag-5'>抽取</b>式摘要方法中如何合理设置<b class='flag-5'>抽取</b>单元?

    了解信息抽取必须要知道关系抽取

    当我们拿到信息抽取任务,需要明确我们抽取的是什么,”今天天气真冷“,我们要抽的天气的状态天气-状态-冷,而非 今天-气候-冷(虽然也可
    的头像 发表于 04-15 14:32 2055次阅读
    了解<b class='flag-5'>信息</b><b class='flag-5'>抽取</b>必须要知道关系<b class='flag-5'>抽取</b>

    开放域信息抽取和文本知识结构化的3篇论文详细解析

    开放域信息抽取信息抽取任务的另个分支任务,其中
    的头像 发表于 04-26 14:44 2719次阅读
    开放域<b class='flag-5'>信息</b><b class='flag-5'>抽取</b>和文本知识结构化的3篇论文详细解析

    面向知识图谱的信息抽取

    摘要: 随着大数据时代的到来,海量数据不断涌现,从中寻找有用信息抽取对应知识的需求变得越来越强烈。针对该需求,知识图谱技术应运而生,并在实现知识互联的过程中日益发挥重要作用。信息抽取
    发表于 03-22 16:59 895次阅读
    面向知识图谱的<b class='flag-5'>信息</b><b class='flag-5'>抽取</b>

    实体关系抽取模型CasRel

    许多实验证明联合学习方法由于考虑了两个子任务之间的信息交互,大大提升了实体关系抽取的效果,所以目前针对实体关系抽取任务的研究大多采用联合学习
    的头像 发表于 07-21 14:11 3854次阅读

    基于统一语义匹配的通用信息抽取框架USM

    信息提取(Information Extraction,IE)需要提取句子中的实体、关系、事件等,其不同的任务具有多样的抽取目标和异质的机构,因此,传统的方法需要针对特定的任务进行模型
    的头像 发表于 01-16 10:21 1093次阅读

    介绍信息抽取的大统方法USM

    信息抽取任务具有多样的抽取目标和异构的结构,而传统的模型需要针对特定的任务进行任务设计和标签标注
    的头像 发表于 02-15 14:13 793次阅读

    基于统一语义匹配的通用信息抽取框架-USM

    信息提取(Information Extraction,IE)需要提取句子中的实体、关系、事件等,其不同的任务具有多样的抽取目标和异质的机构,因此,传统的方法需要针对特定的任务进行模型
    的头像 发表于 02-22 11:09 837次阅读
    基于<b class='flag-5'>统一</b>语义匹配的通用<b class='flag-5'>信息</b><b class='flag-5'>抽取</b>框架-USM

    Instruct-UIE:信息抽取统一大模型

    Instruct-UIE 统一信息抽取任务训练方法,可以融合不同类型任务以及不同的标注规范,统一
    的头像 发表于 04-25 10:46 1702次阅读
    Instruct-UIE:<b class='flag-5'>信息</b><b class='flag-5'>抽取</b><b class='flag-5'>统一</b>大模型