0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

信息检索对话中ConversationShape框架介绍

深度学习自然语言处理 来源:仰望星空 作者:Svitlana Vakulenko, E 2021-04-04 16:54 次阅读

参与混合主动互动的能力是会话搜索系统的核心要求之一。如何做到这一点,人们知之甚少。我们提出了一组无监督的度量标准,称作ConversationShape,通过比较词汇和话语类型的分布来强调每个会话参与者所扮演的角色。以ConversationShape为标准,仔细地研究了几个会话搜索数据集,并将它们与其他对话数据集进行比较,以便更好地理解它们所代表的对话交互类型,无论是由信息搜索者还是助手驱动的。我们发现,同一类型的人与人对话的对话形态与ConversationShape之间的偏离,可以预测人与机器对话的质量。

1. 简介

虽然会话搜索的想法已经存在了几十年,但这个想法最近引起了相当大的关注。会话式用户界面被认为比传统的界面更有利于有效的信息访问。在这种情况下,对话是一种协作过程,允许信息寻求者满足信息需求。会话交互的关键特征之一是混合主动性的潜力,其中系统和用户都可以采取适当的主动性。在这篇论文中,作者提出了一种分析评估对话参与者之间的主动性和协作程度的指标。

迄今为止提出的会话搜索任务主要将对话减少为一系列的问题-答案对。在用于问答任务的数据集中,交互的结构事先是固定的:要么用户主动,系统随后给出答案,要么反过来,这使得它们不适合研究角色之间的主动性如何转移。来自在线问答论坛的讨论是开发会话搜索任务的一个流行的数据来源[18,19]。虽然在线论坛是研究现实世界交互模式的宝贵资源,但它们展示了一种异步信息交换类型,正如我们在分析中所显示的,这与同步对话交互非常不同。

会话系统通常分为问答、任务导向和闲聊。值得注意的是,这种分类模式主要基于构建这种对话系统的方法的不同,而不是它们产生的对话的不同。在本文中,**我们着重分析和测量对话类型之间的差异,并报告由此产生的维度和一个新的对话分类方案。**我们表明,为会话搜索任务收集的人对人对话与面向任务的对话和闲聊对话在结构上具有相似性。

最近对聊天对话模型的评估研究表明,对话系统倾向于通过问太多的问题和忽视用户的主动性来控制对话[4,9]。标准的评估指标不能捕捉到对话互动的这一维度,因此不能预测用户参与度。对话评价最常用的指标是回应的相关性,通常是根据真实的回应来衡量;如果响应是一个答案,那么它可以与答案的准确性相比较。我们的工作是对这项研究的补充。我们提出了一种新的基于一组无监督特征的评价框架。该框架的设计目的是在适当的时候,根据平衡主动性和衡量对话参与者之间的协作来捕获对话互动的质量。

我们的评估框架是基于几个独立的词汇特征,这些词汇特征捕捉了对话中的主动性和协作性。先前采用了基于语篇特征的简单自动测量方法,如词汇和句法多样性,以减少重复的共性回答,并估计问题的复杂性[14,23]。我们使用了一种无监督的方法,类似于在匹配[13]语言风格和衡量生成叙事[22]的质量时所使用的方法。一个关键特征的对话是。它是一种由多个对话参与者产生的话语叙事类型。因此,我们分别估计每个参与者的词汇特征,以便能够比较他们的贡献,从而推断他们在对话中扮演的角色。

我们的对话表示方法是无监督和领域独立的,这允许我们将以前只在少数对话上执行的分析扩展到数千个公开可用的对话文本。

我们的主要贡献可以总结为:(1)我们在10个数据集(超过97k个对话)中考察了主动性和协作的结构模式。我们的研究是第一个在庞大而多样的对话语料库中自动识别这些维度的研究,并将源自不同研究团体的对话任务进行类比。(2)我们所识别的主动性和协作模式与人类对对话质量的判断相关。控制的分配(其中控制被定义为管理会话中的流程方向)是旨在增强人机协作的混合主动对话系统的核心。对话系统应能够识别userâĂŹs提示的主动切换,从而提供适当的回应。检测主动性对于描述交互的质量也很重要。我们的工作有助于洞察,为评估和优化方法的设计提供信息,这些方法能够识别对话中的主动性分配。

2. ConversationShape

ConversationShape是一种关注对话结构属性的对话表示方法。我们认为对话是几个参与者之间交换的一系列话语。我们实验中的所有对话都有两名参与者。然而,我们的方法也适用于多方对话。信息寻求对话的特点通常是参与者在对话中扮演的角色不对称:参与者通常扮演助手(A)的角色,其功能是通过对话搜索系统实现自动化;另一个对话参与者是一个信息寻求者,他正在使用助手的服务来获取信息。为了模拟对话中的混合主动性,我们使用了四个指标,分别为每个对话参与者计算:(1)问题(question);(2)信息(information);(3)重复(repetition);和(4)流(flow)。

问题(question)是一种试图控制谈话方向的明确尝试,因为提出的问题会让另一个参与者产生相应的答案。我们在NPS聊天语料库上训练了一个有监督分类器来识别问题和其他类型的话语。NPS聊天语料库包含了来自网络聊天室的7.9K个话语,标注了14种话语类型:Statement、Emotion、Greet、Bye、Accept、Reject、whQuestion、ynQuestion、yAnswer、nAnswer、Emphasis、Continuer、clear、Other。我们的分类模型是从预先训练的罗伯塔17初始化的,并进一步为话语类型预测任务进行调整,在递出测试集中实现F1为0.81。

其余的度量标准描述协作模式和对对话主题的控制。要解释它们,我们首先需要介绍对话词表的概念。对话词表由出现在同一对话文本中的所有唯一单词(或子单词标记)组成。我们对在同一对话中频繁出现(不止一次)的单词特别感兴趣,因为重复模式很可能表明它们对对话主题的重要性。

信息(information)反映了参与者对谈话主题的贡献。我们将信息估计为会话参与者首先创造的频繁令牌的计数。

重复(repetition)表示对谈话主题的延续。为了分析共享词汇表的出现,我们跟踪会话参与者之间的词汇表重用模式。我们将重复估计为一个会话参与者首先引入并随后被另一个会话参与者重复的标记的数量。我们认为重复是对话中可用的一种相关性反馈,假设重复行为是通过增加标记频率来认可标记对对话主题的重要性。另一种隐式引用前面标记的方法是使用回指。因此,我们将回指计数加到重复计数中。从沃克和惠特克提出的分析框架中,我们使用了一小串英语回指:

“it”,“they”,“they”,“their”,“she”,“he”,“her”,“him”,“his”,“this”,“that”。我们也用现成的共参考分辨率模型进行了实验,但结果并不令人满意。

“流”(flow)是重复和信息之间的区别,它反映了参与者通过引用之前的陈述来维持对话的连贯性,或者通过引入新的信息来推动对话向前的作用。

对于每一次对话,我们分别计算每个对话参与者的值:conceptA和ConceptS(A代表assistant,S代表Seeker),其中Concept表示我们刚刚介绍的四个指标之一。为了能够比较不同长度的对话,我们还通过对话中说话的数量来标准化得分。然后,我们使用两个指标之间的平均值和差值来描述数据集中对话的类型。平均值显示了每个指标的重要性,例如每次对话的平均问题数量:

7c9a5f2a-88e9-11eb-8b86-12bb97331649.png

这种差异可以用来比较对话参与者之间的分布(平衡),例如在对话中谁问了更多的问题。我们使用类似于[13]的写作风格的公式:

7cd16b0a-88e9-11eb-8b86-12bb97331649.png

它不仅表明了不同角色之间的指标差异,而且还表明了其方向:负值表示Seeker的主导地位,正值Assistant表示Assistant的主导地位。

3. 数据集

我们的分析跨越了10个公开可用的对话数据集,这些数据集是为各种对话任务而设计的。括号中的数字表示每个数据集中对话的数量。

4.结果

表1显示了前一节中每个对话集的平均ConversationShape。这种表示允许比较集合并识别不同的对话类型,例如,图1显示了基于问题和信息分布的相似性而出现的集群。

7d2ca97a-88e9-11eb-8b86-12bb97331649.png

7d7e604e-88e9-11eb-8b86-12bb97331649.png

助手驱动对话(Assistant-driven dialogues):从表1中我们可以看到,在CCPE中,助理通过提出问题来引导对话,探索者通过回答问题来跟进(负∆重复)。MultiWOZ和MSDialog也有助理提出的大部分问题,但这些问题是紧跟着探索者提供的问题和答案(正∆重复)。在“ReDial”中,助理通过提供信息和提问来推动对话,而探索者则继续跟进(负∆重复)。

7dcb269a-88e9-11eb-8b86-12bb97331649.png

探索者驱动对话(Seeker-driven dialogue):SCS和WoW的相似之处在于:搜索者主要是提问,助理主要是提供信息。然而,在WoW中,导引头会继续跟随助手介绍的主题(负∆重复),而在SCS中,助手会跟随导引头。聊天对话(Human和Control-H)似乎更接近于起源,表明这种对话类型的参与者之间的主动性更平衡。然而,在DailyDialog数据集中,主动权倾向于对话发起者,后者更有可能提出问题并设置对话主题。

模型诊断:ConversationShape有助于评价对话模式,理解对话模式所表现出的越轨行为类型。这些实验是在Control-M数据集的子集上进行的,这些子集对应于不同对话模型产生的文本。总共有28个模型,我们分别计算每个模型的ConversationShape。然后,我们测量模型分布和为人类-人类对话子集(Control-H)计算的分布之间的交叉熵。最后,我们将我们的结果与原始论文[23]中报道的人类评价结果进行比较。与人类-人类分布的交叉熵最低(0.01)的模型,也是人类法官关于兴趣偏好的模型,其特征是更好的flow和更多的信息共享(information sharing)。

此外,ConversationShape允许解释对话模型所展示的偏差类型。在图2中,我们正确地识别出了问太多问题(优化为好奇、面试官)、重复太多(优化为响应性、鹦鹉式)或没有跟进(优化为多样性或消极响应性、说话者式)的模型。在比较Meena和Mitsuku对话[1]的transcripts时,我们无法达到同样的结果。问题分布表明,Meena和Mitsuku对话在结构上彼此非常不同,也不同于典型的人类闲聊分布。Mitsuku正在被审讯,而Meena则主动提出问题。

5. 结论

在本文中,我们介绍了ConversationShape框架,该框架提供了一组简单但有效的无监督度量,旨在度量会话的主动性和流(flow)。我们的分析揭示了不同对话类型之间的关系,并提出了一组适合在开发和评估对话系统或收集新的对话数据集时考虑的维度。我们的“Repetition”度量(估计会话主题的后续内容)是相当粗糙的,因为它只考虑词法匹配和回指语。尽管我们表明它足以对数据集分布进行高级分析,但预测单个对话的质量需要更细粒度的检查。未来的工作应该集中在开发一个可以解释token之间语义相似度的扩展。下一步将这些指标合并到一个学习算法的优化标准,模型提供一个适当的视角的对话,给一个明确的激励来控制一个适当的平衡,正如我们所展示的,取决于对话的类型。

原文标题:【SIGIR2020】信息检索对话中混合主动性和协同性的分析

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28148

    浏览量

    206078
  • 神经网络
    +关注

    关注

    42

    文章

    4759

    浏览量

    100474

原文标题:【SIGIR2020】信息检索对话中混合主动性和协同性的分析

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    HarmonyOS NEXT应用元服务开发Intents Kit(意图框架服务)技能调用方案概述

    一、概述 技能调用是意图框架依托系统AI多模态大模型能力做深度用户输入理解,并通过解析的用户意图对接应用或元服务内的功能和内容。 二、场景体验 用户通过对小艺对话进行自然语言输入实现内容查询,知识
    发表于 11-08 15:38

    HarmonyOS NEXT应用元服务开发Intents Kit(意图框架服务)本地搜索方案概述

    用户感兴趣的歌曲,那么后续用户在小艺搜索入口中搜索歌名时,系统将会在应用/元服务共享的数据检索对应内容,并使用卡片的形式展示内容结果,当用户点击对应卡片热区时,可以跳转进具体音乐播放页或者直接后台执行
    发表于 11-06 10:59

    芯片封装设计引脚宽度和框架引脚的设计介绍

    芯片的封装设计,引脚宽度的设计和框架引脚的整形设计是两个关键的方面,它们直接影响到元件的键合质量和可靠性,本文对其进行介绍,分述如下:
    的头像 发表于 11-05 12:21 239次阅读
    芯片封装设计引脚宽度和<b class='flag-5'>框架</b>引脚的设计<b class='flag-5'>介绍</b>

    软件系统的数据检索设计

    软件系统的数据检索设计 随着业务量加大,数据检索量也会日益增多,为了减轻数据库压力,本系统采用ElasticSearch来实现数据检索功能。 简单来说,Elasticsearch 是一个实时的分布式
    的头像 发表于 08-22 14:08 220次阅读
    软件系统的数据<b class='flag-5'>检索</b>设计

    Python的人工智能框架与实例

    在人工智能(AI)领域,Python因其简洁的语法、丰富的库和强大的社区支持,成为了最受欢迎的编程语言之一。本文将详细介绍Python的人工智能框架,并通过具体实例展示如何使用这些框架
    的头像 发表于 07-15 14:54 1546次阅读

    微软应用商店无法下载内容,错误显示“信息检索

    用户反映只要试图启动微软应用商店并进行应用安装操作时,页面便立即显示“正在从微软应用商店检索信息”的提示,但是此过程可能会长达数小时之久。
    的头像 发表于 05-14 09:44 576次阅读

    阿里达摩院提出“知识链”框架,降低大模型幻觉

    近日,阿里巴巴达摩院(湖畔实验室)携手新加坡南洋理工大学等研究机构,共同推出了大模型知识链(CoK)框架。该框架不仅可实时检索异构知识源,还能逐步纠正推理错误,有效提高了大模型在回答知识型问题时的准确率,并显著降低了所谓的“幻觉
    的头像 发表于 05-10 11:46 651次阅读

    中兴通讯中标2023年中移动信息IT云系统框架采购项目

    近日,移(动)信息技术有限公司(以下简称中移动信息)公布2023年IT云资源池SDN系统框架采购项目招标结果,中兴通讯以第一名50%份额中标。
    的头像 发表于 03-15 10:20 403次阅读

    源2.0适配FastChat框架,企业快速本地化部署大模型对话平台

    北京2024年2月28日 /美通社/ -- 近日,浪潮信息Yuan2.0大模型与FastChat框架完成全面适配,推出"企业快速本地化部署大模型对话平台"方案。该方案主要面向金融、法律、教育等领域
    的头像 发表于 02-29 09:57 768次阅读
    源2.0适配FastChat<b class='flag-5'>框架</b>,企业快速本地化部署大模型<b class='flag-5'>对话</b>平台

    龙芯中科与中科信息签订合作框架协议

    1月24日,龙芯中科技术股份有限公司与中科院成都信息技术股份有限公司(以下简称“中科信息”)合作框架签约仪式在成都兴隆湖畔科学城园区举行。
    的头像 发表于 01-26 11:44 789次阅读

    HamronyOS自动化测试框架使用指南

    HarmonyOS 3.0 release 版本之后方可使用,历史版本不支持使用。 ● 单元测试框架的部分能力与其版本有关,具体能力与版本匹配信息可见代码仓的文档介绍。 环境准备
    发表于 12-19 10:26

    基于springboot和vue框架的Java

    本文将详细介绍基于Spring Boot和Vue框架进行Java应用开发的实践。首先,将介绍Spring Boot和Vue框架的基本概念及其优点。然后,将详细
    的头像 发表于 12-03 15:15 951次阅读

    GUI图形界面编程文件对话

    文件对话框 文件对话框帮助我们实现可视化的操作目录、操作文件. 将文件、目录的信息传入到程序 文件对话框包含如下一些常用函数 命名参数 o
    的头像 发表于 11-26 16:58 822次阅读
    GUI图形界面编程文件<b class='flag-5'>对话</b>框

    OpenHarmony之NAPI框架介绍

    Studio 应用开发的 cpp 代码,在对应的 CMakeLists.txt 链接。该库文件在 SDK 目录下可以找到。 对于设备侧开发,系统框架的 C++程序,则通过 BUILD.gn 文件定义依赖
    发表于 11-23 15:36

    高效案例检索工具,Alpha案例库智慧检索成为律师检索工具首选

    为不可逆转的趋势。从目前国内律所引入科技工具的现状来看,Alpha法律智能操作系统具有较高的使用率,该系统在律师日常法律检索和律所管理方面都产生了巨大的“动能”。其官网链接:法律检索阿尔法 最新的数据显示,业已有多达
    的头像 发表于 11-20 11:27 584次阅读
    高效案例<b class='flag-5'>检索</b>工具,Alpha案例库智慧<b class='flag-5'>检索</b>成为律师<b class='flag-5'>检索</b>工具首选