0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是query理解?query理解目前的主要作用

深度学习自然语言处理 来源:CS的陋室 2023-02-22 17:54 次阅读

什么是query理解

有关query理解的具体概念,我之前在串讲对话系统的时候有专门讲过,这里就不重复了。(前沿重器[23] | 聊聊对话系统:query理解),还有这篇可以参考(心法利器[70] | 短文本理解的难点和解决方案)

query理解目前的主要作用

但需要强调的,是为什么我们要去做query理解,因为它存在的意义才是我们持续讨论他在后续chatgpt下是否应该存在空间的落脚点。

我们都知道,query理解后的下游内容,是需要给下游使用的,同样的,我们来想想几个场景。

识别天气意图,并且提槽时间、地点信息。方便下游进行查询使用,和功能需求、工程架构是绑定的,如“深圳明天的天气”,我们需要知道天气意图,要去查的是天气库,然后查询的是明天、深圳的天气。

辱骂意图。识别出来后,我们根据用户的语气,可以制定一定的安抚策略,或者引导用户一起解决问题,这里,我们是需要根据意图调整对话策略。

细粒度的数据分析。例如那些意图或者实体是用户高频提到的,此时进行针对性优化能大大提升整体效率。

此时我们可以看到,其实query理解主要是在3个维度有很大作用:

下游的资源获取的信息依据。

对话策略选择的依据。

资源盘点和数据分析的依据。

这里,我们把query理解的作用放在一个系统,甚至一个产品层面来看的,他所提取信息,是可以供多个对象使用的:

系统内的其他组件,如下游的数据查询、数据查询。

用户,理解用户意图后能给出更加精准的回复信息。

系统内其他人员,产品、运营甚至数据分析同事。

目前query理解的系统问题

然而,我们去构造这个模块专门解决这类问题,会不会出现什么问题,答案是肯定的,而且随着技术逐渐迭代,这些问题会逐步明显,甚至可以说是系统问题了,毕竟只要有这个模块,问题就存在,无法解决:

维护成本问题。随着意图、实体的逐渐增加,系统压力会变得非常零散而巨大,可维护性会大大降低,想象一下,当我们要维护几十上百甚至更多意图时,人力、机器的安排安排都是绝大的。

误差的叠加问题。技术上有个共识,我们总不能解决所有问题,我们拆解的步骤越多,中间损失的可能也会越多,最终反馈到端到端层面问题就会更严重,这也是为什么query理解的召准要做的这么高的根本原因,高频的意图、NER都要在双85、双90甚至更高,加了权得奔着95/96去了。

query理解类目体系的模糊问题逐步凸显。在项目初期,我们会关注的是高频、典型的问题,但是随着问题的逐渐深入,我们是需要去解决困难的、边缘的问题的,但是随着query理解而产生的意图、实体体系,我们所关注的问题就会扩展到这些边缘地带,百科和专项知识问答的交叉,多类型艺术作品的重合(如电影、小说)、导航和地点查询的交叉等。

chatgpt内部没有显式query理解

我们其实可以比较明显的知道,chatgpt其实是一个端到端或者说很接近端到端的对话系统方案,在这个方案下,我们可以看到,他们根本不需要意图识别,不需要提槽,就能够给出非常精准的回复(当然,模型内部可能有,但这种事情是隐式的,看不出来),因此很多人也可能会感觉到,模型很轻松地就能够回复复杂多样的问题吗,别说意图识别、提槽这中间基本的任务,词权重、纠错、句法之类的query理解任务似乎都不需要了。

按照以为大佬的说法(张家俊:ChatGPT八个技术问题的猜想),应该是instruct tuning等的技术手段,似乎让模型产生了这种能力,针对绝大多数问题,模型能快速从这个系统里找到所需内容并整合输出,以前这种整合是需要人工拆解并逐步拼接处理的,但是现在,已经能够通过模型一步直达了。甚至,还能够更好地解决我在上一节所提到的三个问题:

维护成本问题。虽说chatgpt是个巨型的模型,但是如果要和成熟、完整的对话、搜索系统比,可能不见得就那么大了,毕竟可能他一个就够。

误差叠加问题。一个模型,不存在叠加。

query理解类目体系的模糊问题逐步凸显。连query理解都没有,什么意图类目体系之类的,根本就不存在,只要是问题,直接给出答案回答就是了。

所以,我们会发现,从设计的角度,他没有query理解,也能够很好地回答问题,甚至解决了搭建query理解模块所存在的固有的系统问题。

后续设计是否还要保留query理解

那么现在问题来了,后续,我们是否还要考虑这个query理解问题呢。先摆出答案,在很多现有系统中或者是设计中,是不能把他放弃的,但是在迭代升级过程中可以把这个给考虑进去。

首先,我们需要承认的是,chatgpt确实能够从系统层面解决了很多问题,很多功能可以逐步从零散非端到端的模块过渡到chatgpt这种比较统一的模块中的,一方面泛化性和总体效果应该会有不晓得提升,另一方面是从维护和管理上,似乎有了一个更为统一的综合模块,这个角度看,维护成本是有所下降的。

但是,我们仍旧不可忽略的是,单独的query理解模块,在对话策略的灵活性、工程资源对接的便捷性以及产品数据分析的可得性上,仍旧有很突出的优势,产品终究是一个系统,内部需要解决的问题有很多,我们不能一概而落,激进地直接把原来的放弃,而转为用新的,目前chatgpt仍旧有很多问题。

因此应该是基于每个业务,甚至业务内的多个功能模块点来综合设计,可以考虑把一些通用性的、开放域的,实时信息资源以来不紧密功能逐步向这里过度,此时意图识别可能没有那么的高优了,但是对于特定的一些场景,例如前面提到的实时性很高的天气,需要定制化的风控安全场景,内容需要频繁更新的场景,则需要更加谨慎,甚至继续走原来的技术路线,也并无不可。

不知道大家有没有发现一个问题

在我写这篇文章的过程中,突然发现一个有意思的事,本文里的chatgpt,把他换成bert,或者是端到端模型,似乎没有很大的违和感,这两个一定程度其实都能起到类似chatgpt的作用,或者说chatgpt的思路其实就是预训练模型的进一步升级,效果提升量变到质变的新的里程碑,这个新的里程碑一定程度让我们对“端到端”方案产生信心,自己在分析时很多时候考虑到的就是端到端和非端到端的对抗,可能有些片面,但是随着逐步分析,会发现其实除了效果体验的好坏,剩下的因素都聚焦在了端到端和非端到端的问题上了,这次聊query理解,最终仍然落到了这个问题上。

抛开效果因素来,我们会发现,chatgpt所代表的其实就是端到端方案目前已知的一个顶峰,它具备很高的泛化能力,同时在工程设计上也带来了很大的便利,而与之对应的就是目前工业界所广泛使用的非端到端的方案,有关这两者的对比和思考,可以看这篇文章:心法利器 | chatgpt下非端到端方案是否还有意义。

而回到效果因素上,毋庸置疑的是,在很多领域下,或者说高频热门的领域下,chatgpt似乎都有非常优秀的效果,这也是让外界恐慌NLP、搜索、对话系统的末日来临的根本原因,没错,就是效果好,用户体验层面看,很多问题确实回复的很好,满足用户了。

但是把多个因素综合在一起,作为实践者的我们,更多应该尽可能比对多种方案,因地制宜地选择才是对的。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Query
    +关注

    关注

    0

    文章

    11

    浏览量

    9319
  • NER
    NER
    +关注

    关注

    0

    文章

    7

    浏览量

    6196
  • ChatGPT
    +关注

    关注

    28

    文章

    1517

    浏览量

    6882

原文标题:chatgpt下query理解是否还有意义

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LabVIEW后面板缺少MB Serial Master Query (poly).vi什么意思

    LabVIEW后面板缺少MB Serial Master Query (poly).vi,这个是少什么模块还是少其他东西。
    发表于 05-08 14:35

    有知道MB Ethernet Master Query返回的簇数据是什么的吗?

    有知道MB Ethernet Master Query返回的簇数据是什么的吗?
    发表于 08-29 09:21

    如何在Query语法中指定这个器件上的焊盘?

    请教一下,我现在有一个卧式贴片的座子,需要放在板边,这样就跟keepout layer的track边界冲突了,如何在Query语法中指定这个器件上的焊盘呢,IsPad好像不能带参数,IsComponentPad试过了也不行。
    发表于 09-19 03:23

    如何在PCB rules中的custom query设置命令?

    PCB rules中的custom query设置命令是什么
    发表于 09-25 00:26

    什么是Query

    什么是Query  英文缩写: Query 中文译名: 查询 分  类: IP与多媒体 解  释: 为了在数据库中寻找某一特定
    发表于 02-23 09:32 804次阅读

    Query_scripts

    Query scripts,好东西,喜欢的朋友可以下载来学习。
    发表于 02-18 16:20 0次下载

    pcb设计之Query语句的应用

    本篇文章综合介绍了Query语句的构建和使用方法,并且采用两个具体案例展示不同的Query表达式配置过程。内容包括常规手动输入查询语句,采用Query Builder 和 Query
    发表于 06-19 10:17 2565次阅读

    实现SQL Query项目的详细资料总结

    本文档的主要内容详细介绍的是实现SQL Query项目的详细资料总结。
    发表于 09-25 11:10 2次下载

    Query是什么意思

    query是请求查询的意思。
    的头像 发表于 07-25 16:08 2w次阅读

    Query软件有什么用

    Query软件能够根据要求从MySql数据库中去查找数据,从而找到自己想要的信息。
    的头像 发表于 07-25 16:19 3149次阅读

    稠密向量检索的Query深度交互的文档多视角表征

    今天给大家带来一篇北航和微软出品的稠密向量检索模型Dual-Cross-Encoder,结合Query生成和对比学习技术,将文档与生成的不同伪query进行深度交互学习构建文档的不同视角的表征向量,再与Query向量进行稠密向量
    的头像 发表于 08-18 15:37 1639次阅读

    如何入门面向自动驾驶领域的视觉Transformer?

    理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入
    的头像 发表于 07-09 14:35 494次阅读
    如何入门面向自动驾驶领域的视觉Transformer?

    基于Transformer的目标检测算法难点

    理解Transformer背后的理论基础,比如自注意力机制(self-attention), 位置编码(positional embedding),目标查询(object query)等等,网上的资料比较杂乱,不够系统,难以通过自学做到深入
    发表于 08-24 11:19 258次阅读
    基于Transformer的目标检测算法难点

    理解KV cache的作用及优化方法

    MQA (Multi Query Attention,多查询注意力) 是多头注意力的一种变体。其主要区别在于,在 MQA 中不同的注意力头共享一个K和V的集合,每个头只单独保留了一份查询参数。
    的头像 发表于 12-04 15:24 5364次阅读
    <b class='flag-5'>理解</b>KV cache的<b class='flag-5'>作用</b>及优化方法

    php的mysqli_query的函数处理

    mysqli_query是PHP中用于执行SQL查询的函数。它允许我们将SQL语句发送到MySQL数据库,并返回一个结果集(如果适用)。在本文中,我们将详细介绍mysqli_query函数的使用,并
    的头像 发表于 12-04 16:03 725次阅读