0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NLP:现有联合抽取工作的不足之处

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习的知识小 2021-01-07 15:06 次阅读

这是一篇关于实体关系联合抽取的工作。关于现有的联合抽取工作,作者提出了两点不足之处:

Feature Confusiong: 用于同样的特征表示进行NER和RE(关系分类)两项任务,可能会对模型的学习造成误解;

现有的基于Table-Filling方法去完成联合抽取的工作,会将表结构转化成一个序列结构,这样导致丢失了重要的结构信息

因此本文的工作有以下特点:

针对NER和RE,分别学习出不同的序列表示(sequence representations)和表格表示(table representations); 这两种表示能分别捕获任务相关的信息,同时作者还涉及了一种机制使他们彼此交互;

保持表格的结构,通过神经网络结构来捕捉二维表格中的结构信息;同时,引入BERT中的attention权重,进行表格中元素表示的学习。

c796a5b0-5036-11eb-8b86-12bb97331649.png

模型的核心部分包括以下模块:

Text Embedding: 对于一个输入的包含n个words的句子,其词向量、字符向量和BERT词向量的共同构成了每个word的表示。

Table Encoder: 目标在于学出 N×N 表格下的向量表示,表格第i行第j列的向量表示,与句子中的第i个和第j个词相对应,如Figure1所示。文中使用基于GRU结构的MD-RNN(多维RNN)作为Text Encoder,在更新表格中当前cell的信息时,通过MDRNN融合其上下左右四个方向上的信息,从而利用了表格的结构特点;同时引入当前cell所对应的两个词在Sequence Encoder下的表示,使得Table Encoder和Sequence Encoder之间发生信息的交流;

c7f39a22-5036-11eb-8b86-12bb97331649.png

Sequence Encoder: Sequence Encoder的结构与Transformer类似,不同之处在于将Transformer中的scaled dot-product attention 替换为文中提出的 table-guided attention。具体地,将Transformer中计算Q,K之间分值的过程直接替换为对应两个word在table中对应的向量:

c8445e30-5036-11eb-8b86-12bb97331649.png

由于 T_ij 融合了四个方向上的信息,能够更加充分的捕捉上下文信息以及词与词之间的关系,同时也使Table Encoder和Sequence Encoder之间产生了双向的信息交流。

c89b028a-5036-11eb-8b86-12bb97331649.png

Exploit Pre-trained Attention Weights: Text Embeddings部分有用到BERT,因此将BERT中各个层上多头attention每个头上的atention权重堆叠起来,得到张量T l ∈ R N × N × ( L l × A l ) T^{l} in mathbb{R}^{N imes N imes (L^l imes A^l)} T和 Text Embedding中每个词的表示,来构成Table的初始输入:

c8fcda28-5036-11eb-8b86-12bb97331649.png

c9423afa-5036-11eb-8b86-12bb97331649.png

作者通过在不同数据集上的实验证明了模型的有效性,并通过消融实验进行了相关的分析。

责任编辑:xj

原文标题:【EMNLP2020】用填表的方式进行实体关系联合抽取

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自然语言处理

    关注

    1

    文章

    619

    浏览量

    13593
  • nlp
    nlp
    +关注

    关注

    1

    文章

    489

    浏览量

    22059

原文标题:【EMNLP2020】用填表的方式进行实体关系联合抽取

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    求助,使用ADS8326IDGKT遇到的疑问求解

    您好: 想请教下这个电路图在设计上有什么不足之处,现在供电电源是使用明纬电源PSD-30C-5DC5V输出- LM1117-3.3 输出3.3V供给ADC使用,GNDS与开关电源的地使用一个电感连接,采样方面MOD+ MOD-接在蓄电池12V上面,参考电源使用的是TL431基准输出提供。
    发表于 12-18 12:01

    PIC单片机的优势和不足之处

    PIC单片机系列,作为美国微芯公司的杰出产品,凭借其卓越的性能和广泛的应用领域,在单片机市场上占据了举足轻重的地位。该系列分为基本级、中级和高级三个级别,旨在满足不同层次的应用需求。 PIC单片机的核心优势在于其CPU采用的RISC结构,这一结构精简而高效,分别包含33、35、58条指令,构成了精简指令集。这种设计不仅减少了指令的数量,还提高了指令的执行效率。 同时,PIC单片机采用了Harvard双总线结构,使得程序存储器和数据存储器的访
    的头像 发表于 09-25 17:22 401次阅读

    nlp逻辑层次模型的特点

    NLP(自然语言处理)逻辑层次模型是一种用于理解和生成自然语言文本的计算模型。它将自然语言文本分解为不同的层次,以便于计算机更好地处理和理解。以下是对NLP逻辑层次模型特点的分析: 词汇层次 词汇
    的头像 发表于 07-09 10:39 417次阅读

    nlp神经语言和NLP自然语言的区别和联系

    神经语言(Neuro-Linguistic Programming,NLP) 神经语言是一种心理学方法,它研究人类思维、语言和行为之间的关系。NLP的核心理念是,我们可以通过改变我们的思维方式和语言
    的头像 发表于 07-09 10:35 802次阅读

    nlp自然语言处理框架有哪些

    自然语言处理(Natural Language Processing,简称NLP)是计算机科学和人工智能领域的一个重要分支,它致力于使计算机能够理解和处理人类语言。随着技术的发展,NLP领域出现了
    的头像 发表于 07-09 10:28 585次阅读

    nlp自然语言处理的主要任务及技术方法

    自然语言处理(Natural Language Processing,简称NLP)是人工智能和语言学领域的一个分支,它研究如何让计算机能够理解、生成和处理人类语言。NLP技术在许多领域都有广泛
    的头像 发表于 07-09 10:26 1216次阅读

    nlp自然语言处理模型怎么做

    自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个重要分支,它涉及到计算机对人类语言的理解和生成。随着深度学习技术的发展,NLP领域取得了显著
    的头像 发表于 07-05 09:59 669次阅读

    nlp自然语言处理的应用有哪些

    自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个分支,它致力于使计算机能够理解和生成自然语言。随着技术的发展,NLP已经在许多领域得到了广泛
    的头像 发表于 07-05 09:55 2691次阅读

    NLP技术在人工智能领域的重要性

    在自然语言处理(Natural Language Processing, NLP)与人工智能(Artificial Intelligence, AI)的交织发展中,NLP技术作为连接人类语言与机器
    的头像 发表于 07-04 16:03 595次阅读

    NLP模型中RNN与CNN的选择

    NLP中的应用场景、工作原理、优缺点,以及在选择时应考虑的关键因素,以期为读者提供一个全面而深入的理解。
    的头像 发表于 07-03 15:59 560次阅读

    什么是自然语言处理 (NLP)

    自然语言处理(Natural Language Processing, NLP)是人工智能领域中的一个重要分支,它专注于构建能够理解和生成人类语言的计算机系统。NLP的目标是使计算机能够像人类一样
    的头像 发表于 07-02 18:16 1236次阅读

    特斯拉频繁调价,马斯克解释传统经销商模式价格不稳

    IT之家发现,Whole Mars博客的Omar认为特斯拉的定价策略缺乏连续性,Sawyer Merritt则指出,虽然定价更为透明,但这或许是特斯拉直销模式的不足之处
    的头像 发表于 04-22 15:15 295次阅读

    UART转RS485电路的不足之处

    当RE#为低时,接收数据; 当RE#为高时,禁止接收; 当DE为高时,发送数据; 当DE为低时,禁止发送。 RO为接收输出端,DI为发送输入端。
    发表于 03-28 10:21 2113次阅读
    UART转RS485电路的<b class='flag-5'>不足之处</b>

    汽车转向器轴承滑动力测试深度解析

    软件平台采用了简仪的锐视测控软件平台,面向对象驱动——FirmDrive,快速实现了AI CI同步采集,确保了力与位移的同步,消除了任何偏移,解决了原有PLC方案存在的不足之处
    发表于 03-07 11:24 432次阅读
    汽车转向器轴承滑动力测试深度解析

    谷歌发布Pixel手机3月功能更新,优化应用屏幕共享和快速配对功能

    除对先前阶段不足之处进行修复和增强系统稳定性外,谷歌还将重点放在了扩大“圈选即搜”(Circle to Search)功能的覆盖范围、优化应用屏幕共享和Fast Pair等功能上。
    的头像 发表于 03-05 10:10 712次阅读