0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知识桥接的因果交互网络(KBCIN)

深度学习自然语言处理 来源:深度学习自然语言处理 2023-04-23 10:02 次阅读

1. 动机介绍

对话中的情感分析已经成为自然语言处理(Natural Language Processing, NLP)界的一个新兴话题。大多数现有的工作主要集中在对话情绪识别上(Emotion Recognition in Conversations, ERC),其目的是预测对话中每个话语的情绪标签[1,2,3]。然而,情感推理任务,如识别对话中情绪背后的原因,还没有被充分研究。最近,Poria等人[4]认为,在对话中识别情绪原因(RECCON)有利于提高情绪分析模型的可解释性和性能。同时,它在一些领域有潜在的应用,如情绪支持系统[5]和共情对话系统[6]。因此,Poria等人[4]引入了一个名为RECCON的新任务,该任务有一个标注情绪原因的数据集。它包括两个不同的子任务:原因跨度抽取(Causal Span Extraction, CSE)和情绪原因蕴含(Causal Emotion Entailment, CEE)。在本文中,我们重点关注CEE子任务,其目标是预测对话历史中哪些特定的语句会引发目标语句中的非中性情绪。

在CEE任务中,有两个主要的挑战。首先,为了捕捉对话者之间相互交织的情感动态变化,有必要通过有效的语境模型来理解语境中的深层语义关联。其次,要准确地将候选语句推理到目标情感上可能很困难,因为因果线索并不总是在语境中明确提及,而是应该通过基于推理来暗示,这就导致了候选语句和目标语句之间存在推理空缺。然而,Poria等人[4]简单地将CEE表述为一个语句对分类问题,这是缺乏足够的对话语境模型和有效的情感原因推理的。因此,为了应对这样的两个挑战,我们将常识性知识(Commonsense Knowledge, CSK)[7]引入CEE。

467edd2e-e041-11ed-bfe3-dac502259ad0.png

图1: 数据集RECCON-DD示例

一方面,以事件为中心的CSK,对语句中提到的事件前后可能发生的事情进行揭示,可以被视为语义层面的桥梁(S-bridge),连接对话的发展,加强相关语句之间的语义依赖,从而深入理解对话的语境信息。如图1左侧所示,语句#7中PersonA想单独离开的事件发生在PersonA告诉PersonB离开的事件之后,这与语句#1和#5相关。

另一方面,根据Moors等人[8],人类的感觉和行动倾向是情绪的两个重要组成部分,并在很大程度上为目标情绪的产生提供了潜在的因果线索。为此,社会交互CSK被用作情绪层面的桥梁(E-bridge)和行动层面的桥梁(A-bridge),根据对话者的感觉和行动倾向所传达的因果线索,将候选语词与目标语词连接起来。在图1中,话语#4中PersonB的狡辩和批评使PersonA感到愤怒,这与目标语句#7所持有的情绪是一致的。此外,语句#5的内容暗示了PersonA的行动倾向是独处,它直接导致了她在目标语句#7中表达的内容。

在本文中,我们提出了知识桥接因果交互网络(Knowledge Bridged Causal Interaction Network, KBCIN),以有效地进行语境建模和情绪原因推理。具体来说,我们将一个对话抽象为一个对话图,以建模对话中的语句间依赖关系。然后,我们引入了以事件为中心的CSKs,包括两种类型isAfter和isBefore,并设计了知识增强的图注意力模块(CSK-Enhanced Graph Attention),将CSKs作为S-bridge在图上进行消息传递。此外,为了填补候选语句和目标语句之间的推理空缺,我们利用社会交互CSKs,x(o)Want和x(o)React作为A-bridge和E-bridge。我们设计了情绪交互模块和行动交互模块,借助这两个bridge所传达的明确的因果线索,准确推理出目标情绪的原因。而上述三个模块构成了知识桥接的因果交互(KBCI)模块,它作为多个注意力头的并列,充分地建模了对话语句之间的相互依赖关系,并将目标情绪与候选语篇精确地联系起来。

为了评估所提出的模型的性能,我们在基准数据集[4]上进行了广泛的实验。我们与CEE、情绪原因抽取(ECE)和情感-原因对提取(ECPE)任务上的基线模型相比,取得了最先进的性能。

这项工作的主要贡献总结如下:

我们将常识性知识引入到因果情感实体化任务中,以填补候选语句和目标语句之间的推理空白。

我们提出了一个新的模型KBCIN,以常识性知识为桥梁,进行全面的对话语境建模和准确的情感原因推理。

在基准数据集上对比大多数强基线的实验结果证明了我们模型的优越性。

2. 模型方法

469478aa-e041-11ed-bfe3-dac502259ad0.png

图3: 整体模型架构图

2.1 特征提取

语句级特征提取。Transformer encoder(Vaswani等人,2017)被作为语句encoder来提取语料级特征。具体来说,对于每条语句,一个特殊的标记[CLS]被拼接到语句的开头。然后,我们将该序列送入语句编码器,从最后一个隐藏层中得到的最大池化后的表示作为每条语句的语句级特征。

46aca27c-e041-11ed-bfe3-dac502259ad0.png

知识获取。在这项工作中,我们使用ATOMIC- 2020[7]作为我们的常识性知识(CSK)基础。它是一个常识知识图,涵盖日常推理知识的社会、物理和时间相关方面。

46bce6a0-e041-11ed-bfe3-dac502259ad0.png

图2: 常识知识图事件中心CSK和社会交互CSK示例

为了充分理解对话中各语句之间的语义依赖关系,并填补候选语句与目标之间的推理空白,我们将CSK作为三座桥梁,分别命名为语义级桥梁(S-bridge)、情绪级桥梁(E-bridge)和动作级桥梁(A-bridge)。更具体地说,我们从ATOMIC-2020中探索了六种CSK,它们被归类为以事件为中心的CSK和社会交互CSK。图2中显示了CSK的例子。一方面,根据事件中心CSK isAfter和isBefore所体现的对话发展的脉络和因果关系,语句之间的深层语义依赖将由此来建立。因此,S-bridge的构建是为了对对话语境进行全面的了解。另一方面,另外两座桥,E-bridge和A-bridge是由社会交互CSK xReact, oReact, xWant和oWant构建的。而x(o)Want是对自身(他人)在事件发生后可能想做什么的描述,而x(o)React体现了自身(他人)在事件发生后的情绪感受。它们从人的感觉和行动倾向的角度出发,填补了候选语词和目标语词之间的推理空白。

为了生成给定语句的CSK表示,我们采用了生成性常识模型COMET[9],该模型是在ATOMIC-2020上训练的。更具体地说,我们使用基于BART[10]的COMET变体。给出对话中的每个语句,形成输入格式,其中r是我们选择的CSK类型,COMET会在关系r下生成推理内容的描述,而COMET最后一层的隐状态表示被用作CSK代表。通过这种方式,对于每个语句,有六种CSK表示,用于对话语境建模和情绪原因推理。它们被表示为,分别是关系类型isAfter、isBefore、xReact、oReact、xWant和oWant的缩写。

2.2 并行的知识桥接因果互动

受多头注意力机制的启发[11],我们提出了并行的知识桥接因果交互块,其目的是为了充分理解对话语境,准确推理出目标语气中的非中性情绪的原因。对于每个模块,它由三个部分组成:CSK增强的图形注意模块,情感互动模块和行为互动模块。

CSK-增强的图注意力模块。我们没有把CEE定义为一个没有明确的语境交互建模的语句对分类问题,而是把对话中的语句抽象为一个对话图,其中当前的语句只与对话历史中的过去的语句相联系。通过这种方式,我们确保语句的互动符合因果关系的性质,即原因只能从过去推理出来。每个节点的表示都是由相应的语句级特征初始化的。此外,我们计算目标语句和候选语句之间的相对距离,并利用相对位置信息来丰富语句的表示。由于每个语句的情绪标签被证明在CEE中起着重要作用[4],我们也考虑到了这一点。因此,每个节点的最终表示是通过以下方式获得的:

46d36f24-e041-11ed-bfe3-dac502259ad0.png

基于原始图注意网络[12],我们设计了CSK增强的图注意力来传播对话图上的信息,并利用以事件为中心的CSK作为S-bridge来测量语句间的语义依赖:

46e04046-e041-11ed-bfe3-dac502259ad0.png

权重被用来衡量当前节点和其邻居之间的相关性。我们将以事件为中心的CSK 和融入进入这个过程:

46f5a210-e041-11ed-bfe3-dac502259ad0.png

与原始的计算语句表示之间的注意力分数的注意力函数不同[12],我们利用以事件为中心的CSK 和作为S-bridge来衡量语句的依赖关系。

47099306-e041-11ed-bfe3-dac502259ad0.png

情绪交互模块。在S-bridge的帮助下对对话语境进行了全面的建模后,我们用两种社会交互 CSK、 和 或作为E-bridge来填补推理空白,并根据情绪因果线索来推理目标情绪。这个想法的灵感来自于这样一个理论:感受是人类情感中最重要的组成部分[8]。因此,目标语句与相应的情绪对那些能够产生与目标语句最相似的情绪或感觉的候选句来说更相关。此外,为了区分说话人内部的依赖性和说话人之间的依赖性,和分别作为说话人内部E-bridge和说话人之间E-bridge。情绪相似度得分可以通过以下方式获得:

4718ccfe-e041-11ed-bfe3-dac502259ad0.png

其中 都是线性变换。是目标语句的索引, 是对话历史中的候选语句的索引。如果目标语句 与候选语句 是同一说话人,则,否则 。然后我们利用情绪相似度得分 来对候选语句的重要性进行加权,并用目标语句的表述来丰富它们:

47340014-e041-11ed-bfe3-dac502259ad0.png

行动交互模块。由于行动倾向是推理人类被引发的情绪的另一个重要组成部分,其他两类社会交互CSK 和 作为A-bridge,使候选语词与目标语句产生关联,并暗示一致的行动倾向。此外,还形成了说话人内部A-bridge和说话人之间A-brige。行动相似性得分为:

474b4288-e041-11ed-bfe3-dac502259ad0.png

行动交互后的权重表示为:

475a22c6-e041-11ed-bfe3-dac502259ad0.png

最后,在每个知识桥接的因果交互块结束时,为了综合推理过程中的结果,我们将对话表征 、情绪表征 和行动表征 加在一起,每个语句的最终表示为:

476da152-e041-11ed-bfe3-dac502259ad0.png

2.3 因果语句预测

在这里,将每个并行的KBCI头的因果表征连接起来作为输入,我们利用一个因果语句预测器来决定候选 是否是目标 的原因:

477c27fe-e041-11ed-bfe3-dac502259ad0.png

3. 实验

3.1 数据集

478a69a4-e041-11ed-bfe3-dac502259ad0.png

表1: 经处理的RECCON-DD的统计数据

我们在基准数据集RECCON-DD上进行了实验。它是在数据集DailyDialog[13]的基础上,标注了情绪原因标签。我们只考虑对话历史中的原因,重复的因果对被删除。表1显示了经过处理的RECCON-DD的统计数据。

3.2 主实验结果及分析

47a11abe-e041-11ed-bfe3-dac502259ad0.png

表2: 主实验结果

如表2所示,我们提出的模型在REECON-DD数据集上取得了最好的结果。由于RoBERTa-Base/Large的结果和ECPE的方法是在与我们相同的数据集规模下实现的,我们直接参考了Poria等人[4]的结果,我们在相同的环境下重新实现了KEC和ECE任务下的方法。受益于通过S-bridge进行的有效对话语境建模和通过E-bridge和A-bridge进行的准确情绪原因推理,KBCIN取得了最先进的Pos. F1和macro F1分数,分别为68.59和79.12。

3.3 消融实验

47aea9d6-e041-11ed-bfe3-dac502259ad0.png

表3: 消融实验结果

我们进行了消融实验,以验证我们模型中提出的不同模块的有效性。从表3的结果可以看出,三个bridge均对情绪原因的推理起到正向的增强作用。

3.4 情绪信息的影响

47c00a5a-e041-11ed-bfe3-dac502259ad0.png

表4: 情绪信息影响分析

为了进一步研究对话历史中每条语句的情绪信息的影响,我们要么删除情绪信息,要么用情绪识别模型预测的标签替换真实情感标签。结果展示在表4中。我们之所以用预测的标签来测试KBCIN的性能,是因为在实际应用的情况下,情绪识别是情绪原因提取的前置过程,这意味着在实际应用中的情绪原因抽取系统中,对话历史中语句的这种真实情感标签可能无法获得。使用预测的情绪标签导致的结果下降,提醒我们要尝试在对话中联合进行情绪识别和情绪原因提取,这样可以在两个任务之间共享相关的情绪信息,缓解两阶段使用情绪信息带来的错误级联传播问题。

3.5 知识桥接块的数量

47cfaeec-e041-11ed-bfe3-dac502259ad0.png

图4: 知识桥接块数量影响分析

由于KBCI是我们模型的创新和关键部分,用于有效的对话语境建模和准确的情绪原因推理,我们调整了不同数量的KBCI块来深入分析性能。结果显示在图4中。随着KBCI块的数量从1到5的增加,配有2个KBCI块的模型取得了最好的性能。

4. 结论

在本文中,我们提出了知识桥接的因果交互网络(KBCIN),用于情绪原因的推理。常识知识(CSK)被用作三个桥梁来进行有效的对话语境建模和准确的情绪原因推理。具体来说,我们将对话抽象为一个对话图,并利用以事件为中心的CSK作为语义层面的桥梁(S-bridge),通过CSK增强的图注意力模块在图上进行消息传递,来增强深层次的语义间的依赖性。而社会交互CSK作为情绪级桥梁(E-bridge)和行动级桥梁(A-bridge),从人的感觉和行动倾向的角度为情绪交互模块和行动交互模块提供显示的因果线索,填补了候选语句与目标语句之间的推理空白。基准数据集的实验结果证明了我们提出的KBCIN的有效性。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24639
  • 自然语言处理

    关注

    1

    文章

    612

    浏览量

    13504
  • nlp
    nlp
    +关注

    关注

    1

    文章

    487

    浏览量

    22010

原文标题:参考文献

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    COM和CORBA的与应用

    根据CORBA规范,阐述了组件的体系结构和六种模型,并引申出八种方式,比较了各种
    发表于 02-27 16:07 29次下载
    COM和CORBA的<b class='flag-5'>桥</b><b class='flag-5'>接</b>与应用

    网桥和,网桥和是什么意思

    网桥和,网桥和是什么意思 网桥(Bridge)也称桥接器,是连接两个局域网的存储转发设备,用它可以完成具有相同或相似体系
    发表于 03-20 16:03 1.3w次阅读

    无线中继和的区别是什么

    无线也就是WDS(Wireless Distribution System,无线分布式系统),其可以无线网络相互连接的方式构成的一个整体无线网络。WDS可把有线
    发表于 12-26 13:42 9.5w次阅读
    无线中继和<b class='flag-5'>桥</b><b class='flag-5'>接</b>的区别是什么

    双频路由与单频路由如何

    (Bridging),是指依据OSI网络模型的链路层的地址,对网络数据包进行转发的过程,工作在OSI的第二层。一般的交换机,网桥就有
    发表于 04-04 15:05 9860次阅读

    基于因果知识和时空关联的攻击场景重构技术

    片段,难以发现和识别多步攻击模式,无法还原攻击者完整的攻击渗透过程。针对这一问题,提出了基于因果知识和时空关联的攻击场景重构技术。首先,利用贝叶斯网络因果
    发表于 04-14 16:13 14次下载
    基于<b class='flag-5'>因果</b><b class='flag-5'>知识</b>和时空关联的攻击场景重构技术

    多个路由器如何无线成一个网络 路由器教程

    多个路由器如何无线成一个网络 路由器教程
    发表于 09-28 09:25 1次下载

    信号链中的""知识

    信号链中的""知识
    发表于 11-07 08:07 3次下载
    信号链中的"<b class='flag-5'>桥</b><b class='flag-5'>接</b>"<b class='flag-5'>知识</b>

    路由器技术的优缺点和设置步骤

      路由器的是指将两个或者多个局域网(LAN)互相连接的过程。在网络拓扑结构中,技术可以扩展局域网的面积覆盖范围,增加
    发表于 05-08 17:24 1.3w次阅读

    无线和mesh组网哪个好?

    无线和Mesh组网都是用于扩展无线网络覆盖范围的技术,但它们的工作原理和应用场景有所不同。 无线接通常是一对一的连接,相对较容易设置和维护。它的优点在于简单性,适用于需要建立点对
    的头像 发表于 01-19 16:12 7455次阅读

    小米路由器如何配置有线

    小米路由器如何配置有线? 小米路由器作为一款智能、高性能的路由器产品,在无线网络覆盖方面表现出色,但如果你的家庭或办公环境需要更广阔的网络覆盖,有线
    的头像 发表于 02-04 14:07 5607次阅读

    为什么要无线路由器?如何通过网线将两个路由器进行

    为什么要无线路由器?如何通过网线将两个路由器进行?两台路由器有线的两种方法  为什么
    的头像 发表于 02-04 14:07 2607次阅读

    路由器路由器怎样 路由器接好还是中继好

    路由器和中继是常用的网络扩展方式,用于扩大网络覆盖范围,提供更好的网络连接。这两种方式在不同的场景下有着各自的优势,下面将详细介绍如何
    的头像 发表于 02-20 14:26 5050次阅读

    网络模式是什么? 网络模式和路由模式的区别

    网络模式是一种网络连接方式,它可以将多个设备连接在一起,使它们可以相互通信。在网络
    的头像 发表于 05-10 13:48 4030次阅读

    wds无线怎么设置

    无线分布式系统(Wireless Distribution System,简称WDS)是一种允许无线网络设备之间进行的技术。通过WDS,可以将多个无线设备连接在一起,形成一个更大的无线网络
    的头像 发表于 07-18 09:59 936次阅读

    无线wifi设置方法详细步骤

    无线Wi-Fi是一种将两个或多个网络连接在一起的技术,通常用于扩展无线网络的覆盖范围。 1. 准备工作 两台无线路由器 :一台为主路由器(连接到互联网),另一台为
    的头像 发表于 10-18 09:17 1387次阅读