实体关系联合抽取取得SOTA的三种方法-电子发烧友网

2020实体关系联合抽取一片红海，各种SOTA方法你方唱罢我方登场，在一些数据集上也是不断刷出新高度，为信息抽取领域带来了新思路，推动了信息抽取领域的发展。本文梳理了实体关系联合抽取取得SOTA的三种方法，以做总结。

先总体对三种方法做个比较：*表示Exact Matching

以下将对上面提到的三篇文章依次进行详细解读。

CasRel

论文：A Novel Cascade Binary Tagging Framework for Relational Triple Extraction

地址：https://arxiv.org/abs/1909.03227

arxiv访问不方便的同学后台回复『0016』直接获取

2019年的时候看到苏剑林在paperweekly上的一篇文章，阐述了其在参加百度SPO竞赛中所使用的方法，这篇论文可以认为是之前所提方法的延伸。

论文提出级联二分标记框架CasRel方法（a novel cascade binary tagging framework），与以往把关系看着离散标签不同，这里把关系看着是一个函数fr(sub)->obj，头实体sub是自变量，尾实体obj是因变量，先抽取出头实体，然后结合各关系类型，进一步抽取出对应的尾实体。该方法可以解决实体关系中的EPO/SEO实体重叠问题。结合模型框架图更好理解：

CasRel模型可以分两部分理解：

编码部分：采用Bert进行编码，输入subword embedding + position embedding

Cascade解码（级联解码）：先对subject实体进行抽取（subject tagger），然后对每一种关系，进一步去抽取该关系下subject所对应的object实体（relation-specific object tagger）。

subject实体抽取：直接在Bert编码后进行span解码，得到实体的start和end位置，如图示，对每个token位置做二分类，判断是否为start位，或者是否为end位。注意：在解码的时候，start和end配对可以采用就近原则得到实体

特定关系下的object实体抽取：结合上图示，obj实体解码类似于sub的解码，需要注意两点：一是对每种关系都要做obj解码，二是obj的解码中引入了上一步中所得到的sub实体的信息Vsub，Vsub是对sub实体中各token向量求平均。当start_o和end_o经过二分判断都为0时，表示该关系下没有对应的obj实体，也即该sub为头实体时不存在这个关系的三元组。

优化目标及模型损失函数：目标是最大化三元组抽取概率，sub和obj的抽取都是采用span方式，可采用二分交叉熵计算loss。优化目标公式如下：

实验结果

在NYT和WebNLG两个数据集上达到了SOTA，如下图所示，即使不使用Bert进行编码（使用LSTM）效果依然是十分显著的。实验同时对比了句子中不同三元组数目下的结果，以及Normal、EPO和SEO三种情况下的结果，实验显示CasRel方法在多三元组、EPO和SEO情况下效果提升更明显。

总结：

级联两个任务，两个任务独立解码，共享编码，这种模型架构也可以算到多任务学习的范畴，模型先抽取出sub实体，再在各个relation下去抽sub实体对应的obj实体，把relation看成函数，模型整体架构很清晰，特别是在relation纬度上做堆叠，打开了关系抽取的新思路。

TPLinker

论文：TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking

地址：https://arxiv.org/abs/2010.13415

arxiv访问不方便的同学后台回复『0017』直接获取

这篇文章提出TPLinker方法（Token Pair Linking）能够end2end对实体及实体关系三元组进行联合抽取，可解决实体关系抽取中的SEO、EPO、实体嵌套等问题。其设计了一种很巧妙的数据标注方式，被称为Handshaking tagging scheme，这种标注统一了实体及实体关系的信息，同时避免了以往其他方法中普遍存在的标签曝光偏差问题（exposure bias）（训练阶段标签使用ground true，推断阶段标签使用predict tag）。

Handshaking tagging scheme:个人感觉文中所给图示（下图）其实不太好理解，从具体例子出发会更方便理解的。

为长度为n的句子，构造nxn的矩阵M，行、列分别对应着句子中的token，针对句子中的实体及实体关系设计三种标注方式：

entity head to entity tail (EH-to-ET):对每个实体，将它的头token(行)对应的尾token(列)位置标记为1，反应在M的上三角上，如所给例子实体：New York City ==> M(New, City) = 1, De Blasio ==> M(De, Blasio) =1，上图中紫色背景。

subject head to object head (SH-to-OH):对每个关系下的实体对，将首实体(sub)的头token(行)对应到尾实体(obj)的头token(列)，如所给例子关系mayor实体对：(New York City, De Blasio) ==> M(New, De)，上图中红色背景。

subject tail to object tail (ST-to-OT): 对每个关系下的实体对，将首实体(sub)的尾token(行)对应到尾实体(obj)的尾token(列)，如所给例子关系mayor实体对：(New York City, De Blasio) ==> M(City, Blasio)，上图中蓝色背景。

注意：EH-to-ET只会存在M的上三角，而SH-to-OH和ST-to-OT是上下三角都会存在的，为了节省存储资源，同时减少目标tag的稀疏性（还是很稀疏），将M的下三角映射到上三角上，值设置为2。（考虑上三角映射的位置上会不会不为0呢，是会存在这种可能的，但现实中概率很低，如triple (ABC, R, CDE)和(CDE, R, BC)）

上面将三元组中的实体信息映射到矩阵上三角，然后将其展平为标记序列，可以得到序列的长度为n*(n+1)/2。如果有N中关系，则经过Handshaking tagging后，得到2N+1个标记序列。

解码方式：

先不用去看下面所给的解码图示，考虑上面讲到的Handshaking tagging作为模型的预测目标，实际上是2N+1个n*n的矩阵，矩阵的元素为句子各token对的关系，其值为0、1、2。其中一个矩阵标记了实体EH-to-ET，N个矩阵标记了SH-to-OH，N个矩阵标记了ST-to-OT。文章给出了一个解码的算法流程，不再贴出，简述过程如下：

解码EH-to-ET可以得到句子中所有的实体，用实体头token idx作为key，实体作为value，存入字典D中

对每种关系r，解码ST-to-OT得到token对存入集合E中，解码SH-to-OH得到token对并在D中关联其token idx的实体value

对上一步中得到的SH-to-OH token对的所有实体value对，在集合E中依次查询是否其尾token对在E中，进而可以得到三元组信息。

三相异步电动机三种调速方法

。为了满足不同的应用需求，人们开发了多种调速方法。 1. 变极调速变极调速是通过改变电动机的极数来实现调速的一种方法。这种方法适用于恒转矩负载，如鼓风机、水泵等。原理三相异步电动

发表于 10-12 15:30 •1188次阅读

光纤测试方法有哪三种

光纤测试是确保光纤通信系统性能和可靠性的重要环节。光纤测试方法多样，主要包括插入损耗测试、回波损耗测试和光纤端面检查。以下是对这三种测试方法的介绍： 1. 插入损耗测试插入损耗测试是测量光纤链路中

发表于 09-24 09:31 •539次阅读

NPN型晶体管三种状态判断方法

NPN型晶体管作为电子学中的基础元件，具有放大、开关等多种功能。其工作状态根据基极、发射极和集电极之间的电压和电流关系可分为截止状态、放大状态和饱和状态。以下是对NPN型晶体管三种状态判断方法的详细阐述，旨在提供全面且深入的理解

发表于 08-13 17:33 •1352次阅读

MCUXpresso IDE下在线联合调试双核MCU工程的三种方法

大家好，我是痞子衡，是正经搞技术的痞子。今天痞子衡给大家分享的是MCUXpresso IDE下在线联合调试i.MXRT1170双核工程的三种方法。

发表于 08-08 15:18 •469次阅读

MCUXpresso IDE下在线<b class='flag-5'>联合</b>调试双核MCU工程的<b class='flag-5'>三种方法</b>

数字示波器的测量方法有哪三种

数字示波器是一种广泛应用于电子测量领域的仪器，它能够实时显示电压波形，帮助工程师和技术人员对电子信号进行分析和测量。数字示波器的测量方法有很多种，不同的测量方法适用于不同的应用场景。以下是三种

发表于 07-17 18:02 •1407次阅读

NB81是否支持OneNet SOTA功能？应该如何激活SOTA？

NB81是否支持OneNet SOTA功能？可以支持，应该如何激活SOTA？

发表于 06-04 06:14

信号调制的三种基本方法

号调制的三种基本方法：调幅（AM）、调频（FM）和调相（PM），并分析它们的优缺点及应用场景。调幅（AM） 2.1 调幅原理调幅（Amplitude Modulation，AM）是一种将低频信号的幅度变化映射到高频载波信号的

发表于 06-03 09:38 •2910次阅读

三种常见的光纤光缆链接方法

三种常见的光纤光缆链接方法分别是：永久性光纤连接(又叫热熔)：这种连接是用放电的方法将两根光纤的连接点熔化并连接在一起。一般用在长途接续、永久或半永久固定连接。其主要特点是连接衰减在所有的连接

发表于 03-01 13:47 •2236次阅读

三菱M70 PLC增加注解的三种方法简析

三菱M70 PLC增加注解的三种方法

发表于 02-26 09:59 •1048次阅读

放大电路有哪三种基本分析方法?举例说明

放大电路是电子电路的重要组成部分，它起到放大信号的作用。在设计和分析放大电路时，有三种基本的分析方法：传输特性分析、小信号分析和大信号分析。接下来，我将详细介绍这三种分析方法，并举例说

发表于 02-25 15:56 •2593次阅读

传统激光功率衰减的三种方法

传统激光功率衰减通常使用以下三种方法，分别为中性密度衰减片衰减法、偏振衰减法、镀膜光学镜片衰减法。

发表于 01-20 10:42 •1666次阅读

异步电机主要的三种调速方法解析

异步电机主要的三种调速方法解析

发表于 01-07 17:50 •2247次阅读

无人机测深的三种方法总结

无论是陆地测绘还是海洋测绘，测绘行业都是朝着航空方向发展。下面结合搜索到的论文和相关网页，总结下无人机测深的方法，总共有三种：1）机载激光雷达；2）机载探地雷达（GPR）；3）机载高精度测深仪。

发表于 01-05 11:24 •1740次阅读

电源的三种常用冷却方法

在电源领域，散热至关重要，它可直接影响电源性能、可靠性和寿命。随着电子元件的尺寸不断缩小，功率越来越大，有效的冷却方法对于防止过热和确保最佳功能至关重要。在本文中，我们将深入独具吸引力的电源冷却领域，并探讨三种常用方法的优缺点：

发表于 12-03 10:29 •992次阅读

linux网络配置的3种方法

Linux是一种流行的操作系统，广泛应用于服务器和网络设备中。Linux系统提供了多种方法来配置网络连接，使得网络设置更加灵活和可定制。本文将会介绍Linux网络配置的三种方法，包括命令行方式

发表于 11-27 14:33 •4268次阅读