0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

复杂知识库问答任务的典型挑战和解决方案

深度学习自然语言处理 来源:专知 作者:专知 2021-06-13 09:49 次阅读

知识库问答旨在通过知识库回答自然语言问题。近来,大量的研究集中在语义或句法上复杂的问题上。在本文中,我们精心总结了复杂知识库问答任务的典型挑战和解决方案,介绍了复杂知识库问答的两种主流方法,即基于语义解析(基于SP)的方法和基于信息检索(基于IR)的方法。首先,我们形式化地定义了知识库问答任务并介绍了该任务下相关的数据集。然后,我们从两个类别的角度全面回顾了前沿方法,说明他们针对典型挑战的解决方案。最后,我们总结并讨论了一些仍具有挑战的未来研究方向。

知识库(KB)是一个结构化的数据库,它以(主题、关系、对象)的形式包含一系列事实。大型KBs,如Freebase [Bollacker et al., 2008], DBPedia [Lehmann et al., 2015]和Wikidata [Tanon et al., 2016],已经构建服务于许多下游任务。知识库问答(KBQA)是一种基于知识库的自然语言问答任务。KBQA的早期工作[Bordes et al., 2015; Dong et al., 2015; Hu et al., 2018a; Lan et al., 2019b; Lan et al., 2019a]专注于回答一个简单的问题,其中只涉及一个单一的事实。例如,“j·k·罗琳出生在哪里?”“是一个可以用事实来回答的简单问题”(J.K.罗琳)罗琳,出生地,英国)。

最近,研究人员开始更多地关注于回答复杂问题,即复杂的KBQA任务[Hu et al., 2018b; Luo et al., 2018]。复杂问题通常包含多个主题,表达复合关系,并包含数值运算。以图1中的问题为例。这个例题的开头是“the Jeff Probst Show”。这个问题不是问一个单一的事实,而是要求由两个关系组成,即“被提名人”和“配偶”。该查询还与一个实体类型约束“(Jeff Probst,是一个电视制作人)”相关联。最后的答案应该通过选择有最早结婚日期的可能候选人来进一步汇总。一般来说,复杂问题是涉及多跳推理、约束关系、数值运算或上述几种组合的问题。

回到简单KBQA的解决方案,已经提出了两种主流方法的一些研究。这两种方法首先识别问题中的主题,并将其链接到知识库中的实体(称为主题实体)。然后,通过执行已解析的逻辑形式或在从知识库中提取的特定于问题的图中进行推理,在主题实体的邻近区域内获得答案。这两类方法在以往的工作中通常被称为基于语义解析的方法(基于SP的方法)和基于信息检索的方法(基于IR的方法)[Bordes et al., 2015; Dong et al., 2015; Hu et al., 2018a; Gu et al., 2020]。它们包括解决KBQA任务的不同工作机制。前一种方法用符号逻辑形式表示问题,然后对知识库执行它,获得最终答案。后一种方法构造一个特定于问题的图,给出与问题相关的全面信息,并根据其与问题的相关性对抽取的图中的所有实体进行排序。

然而,当将这两种主流方法应用于复杂的KBQA任务时,复杂的问题会给这两种方法的不同部分带来挑战。我们认为主要挑战如下:

现有基于SP的方法中使用的解析器难以覆盖各种复杂的查询(例如,多跳推理、约束关系和数值运算)。类似地,以前的基于ir的方法可能无法回答复杂的查询,因为它们的排序是在没有可追溯推理的情况下对小范围实体执行的。

在复杂问题中,更多的关系和主题意味着更大的潜在逻辑形式的搜索空间,这将显著增加计算成本。同时,更多的关系和被试会阻碍基于IR的方法检索所有相关实体进行排序。

两种方法都把理解问题作为首要步骤。当问题在语义和句法方面都变得复杂时,就要求模型具有较强的自然语言理解和泛化能力。

对于复杂问题,为答案标记ground truth路径是非常昂贵的。通常,只提供问答对。这表明基于SP的方法和基于IR的方法需要分别在没有正确逻辑形式和推理路径标注的情况下进行训练。这种微弱的监管信号给两种方式都带来了困难。

关于相关综述,我们观察到Wu等人[2019]和Chakraborty等人[2019]回顾了关于简单KBQA的现有工作。此外,Fu等人[2020]研究了复杂KBQA的当前进展。他们只从技术的角度提供了高级方法的一般观点,而更多地关注于电子商务领域的应用场景。与这些综述不同的是,我们的工作试图识别在以往的研究中遇到的挑战,并以全面和有序的方式广泛讨论现有的解决方案。具体来说,我们将复杂KBQA的方法根据其工作机制分为两种主流方法。我们将这两种方法的整个过程分解为一系列模块,并分析每个模块中的挑战。我们相信这种方式特别有助于读者理解挑战,以及如何在现有的复杂KBQA解决方案中解决这些挑战。此外,我们还对复杂KBQA的几个有前途的研究方向进行了展望。

原文标题:IJCAI2021最新「复杂知识库问答研究」综述论文,阐述KBQA方法、挑战与对策

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3640

    浏览量

    63745
  • 自然语言
    +关注

    关注

    1

    文章

    271

    浏览量

    13239

原文标题:IJCAI2021最新「复杂知识库问答研究」综述论文,阐述KBQA方法、挑战与对策

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    信雅达大模型智能问答产品发布 运营知识助手“小雅”上线

    金融机构带来全新的工作体验。 信雅达运营智能知识助手“小雅”,是一款专为商业银行打造的办公辅助工具。其基于信雅达“雅问知识湖”,紧密结合银行金融知识库,在银行运营场景内对传统FAQ问答
    的头像 发表于 04-07 17:30 260次阅读

    中软国际多项产品入选工业和信息化部2023年中小企业数字化转型典型产品和解决方案

        为促进中小企业数字化转型供需对接,工业和信息化部中小企业局组织开展了2023年中小企业数字化转型典型产品和解决方案征集工作。经企业自主申报、地方中小企业主管部门推荐,近日,中国工业互联网
    的头像 发表于 02-29 09:53 335次阅读
    中软国际多项产品入选工业和信息化部2023年中小企业数字化转型<b class='flag-5'>典型</b>产品<b class='flag-5'>和解决方案</b>

    汽车网络安全-挑战和实践指南

    汽车网络安全-挑战和实践指南
    的头像 发表于 02-19 16:37 271次阅读
    汽车网络安全-<b class='flag-5'>挑战和</b>实践指南

    PCB金手指设计的常见问题和解决方案

    PCB金手指设计的常见问题和解决方案
    的头像 发表于 12-25 10:09 958次阅读

    应对复杂环境:配网故障定位系统的挑战解决方案

    随着电力系统的不断发展,配电网络日益庞大,复杂的环境和多样化的故障类型给电网运维带来了巨大的挑战。为了提高配电网络的安全性和可靠性,需要研发一套高效的配网故障定位系统。恒峰智慧科技将探讨这一系统面临的挑战以及
    的头像 发表于 12-08 10:35 227次阅读

    HDI 布线的挑战和技巧

    HDI 布线的挑战和技巧
    的头像 发表于 12-07 14:48 308次阅读

    如何基于亚马逊云科技LLM相关工具打造知识库

    了解其核心组件、快速部署指南以及LangChain集成及其在电商的应用场景。 通用场景:基于企业内部知识库例如IT/HR信息的问答 制造行业:装备维保知识库问答和售后客服 金融行业:智
    的头像 发表于 11-23 17:53 684次阅读
    如何基于亚马逊云科技LLM相关工具打造<b class='flag-5'>知识库</b>

    DC/DC转换器功率降额规范中的挑战和替代方法

    DC/DC转换器功率降额规范中的挑战和替代方法
    的头像 发表于 11-23 09:08 333次阅读
    DC/DC转换器功率降额规范中的<b class='flag-5'>挑战和</b>替代方法

    借助亚马逊云科技大语言模型等多种服务打造下一代企业知识库

    背景 知识库需求在各行各业中普遍存在,例如制造业中历史故障知识库、游戏社区平台的内容知识库、电商的商品推荐知识库和医疗健康领域的挂号推荐知识库
    的头像 发表于 11-02 11:22 470次阅读
    借助亚马逊云科技大语言模型等多种服务打造下一代企业<b class='flag-5'>知识库</b>

    基于芯片3D堆叠的设计自动化解决方案

    1.3D芯片栈的动机、口味和示例 2.经典挑战-加重但可解决 3.新的设计挑战和新出现的解决方案
    发表于 10-24 09:59 197次阅读
    基于芯片3D堆叠的设计自动化<b class='flag-5'>解决方案</b>

    面部表情识别的技术挑战解决方案

    面部表情识别是一项复杂的技术挑战,面临着许多问题,如表情的多样性、肌肉运动、光照条件等。本文将探讨面部表情识别的技术挑战和解决方案,以促进该技术的发展和应用。 首先,面部表情的多样性是面部表情识别
    的头像 发表于 08-24 18:24 446次阅读

    面部表情识别技术的挑战解决方案

    面部表情识别是一项复杂的技术,面临着许多挑战,如表情的多样性和变化性、面部肌肉运动、光照条件等。本文将探讨面部表情识别技术的挑战和解决方案,以促进该技术的发展和应用。 首先,面部表情的多样性和变化
    的头像 发表于 08-10 18:09 454次阅读

    陶瓷线路板在激光雷达传感器中面临的挑战和解决方案

    也面临着一些挑战,如光学干扰和信号噪声等问题。本文将探讨这些挑战,并提出相应的解决方案。 二、挑战一:光学干扰 光学干扰是激光雷达传感器中的一个常见问题,它主要来自于环境中的光线、反射
    的头像 发表于 08-03 11:45 865次阅读
    陶瓷线路板在激光雷达传感器中面临的<b class='flag-5'>挑战和解决方案</b>

    问答对话文本数据:解锁智能问答的未来

    对话文本数据是指在问答对话过程中产生的文本记录。这些数据包含了用户提出的问题以及智能问答系统返回的答案或解决方案。通过收集、整理和分析这些问答对话文本数据,我们可以构建强大的
    的头像 发表于 07-13 14:19 368次阅读

    利用陶瓷电路板优化信号要点:挑战和解决方案

    引言:在现代高速电子系统中,保持信号的缺陷和准确传输至关重要。信号缺陷问题可能导致失真、误操作和功率丢失信号等不良影响。为了解决这些问题,陶瓷电路板作为一种优质的材料选择,被广泛研究和评估信号缺陷。本文将探讨利用陶瓷电路板优化信号缺陷的挑战和解决方案,并介绍相关的技术进展和应用案例。
    的头像 发表于 07-10 14:56 374次阅读