0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于用于自然语言生成的“语境调优”技术

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2022-10-14 15:38 次阅读

一、引言

自然语言生成(又称为文本生成)旨在基于输入数据用人类语言生成合理且可读的文本。随着预训练语言模型的发展,GPT-3,BART等模型逐渐成为了生成任务的主流模型。近年来,为了利用预训练阶段编码的丰富知识,提示学习成为了一个简单而强大的方法。

这篇工作主要聚焦于开放式文本生成,例如故事生成和评论生成。在这种场景下,输入仅包含有限的信息,而任务目标是要生成富含信息量且与主题相关的长文本。例如下表中的例子,我们需要写一段关于“live-action”和“animation”的评论,这需要对这两个主题的背景信息有深入的了解。现有的提示学习方法,会在输入前加上人工的离散提示(例如表中的“Write a story about:”),或者在输入前加上可学习的连续型提示。但是这些提示是静态的,更多是包含任务相关的信息,但与输入无关,很难依靠他们去生成富含信息量的文本。

61060508-4ade-11ed-a3b6-dac502259ad0.jpg

同时在长文本生成中,一个常见的问题是“跑题”,即生成的文本逐渐和主题无关。为了解决以上两个问题,我们分别提出了语境提示(contextualized prompts)连续反向提示(continuous inverse prompting),来增强生成文本的信息量相关性

二、语境调优(Context-Tuning)

本文提出了一种创新的连续提示方法,称语境调优,用于微调预训练模型来进行自然语言生成,我们的核心贡献有三点:①我们首次提出了输入相关的提示——语境提示,抽取预训练模型中的知识作为提示来丰富生成文本的信息量。②我们使用了连续反向提示,最大化基于输出生成输入的概率,来增强生成文本的相关性。③我们使用了一种轻量化的语境调优方法,在只微调0.12%参数的情况下保持98%的性能

1.语境提示(contextualized prompts)

语境提示是基于输入文本生成的提示,我们使用BERT作为提示生成器来抽取模型中有关输入的知识,以此达到丰富信息量的目的。 611f56ac-4ade-11ed-a3b6-dac502259ad0.jpg   具体的,我们在  两端各放置  个  得到BERT的输入:    经过BERT的编码,我们得到这些  的顶层表示,作为初始提示:    然后我们使用一种“语义对齐”操作,将这些隐提示对应到真实词表空间,得到我们的语境提示  :    其中  是BERT的词表矩阵,  是BERT预测  的映射矩阵。直觉地,我们可以将语义对齐操作看做是预测  的概率分布,然后将相应的词向量加权平均。   最后我们将语境提示加在输入两端,使用BART作为我们的生成模型,建模输入  到输出  的概率:    2.连续反向提示(continuous inverse prompting) 连续反向提示通过建模从输出到输入的反向过程,改进自然语言生成,使生成文本与输入的相关性更强。 615e44b6-4ade-11ed-a3b6-dac502259ad0.jpg   我们有这样一个假设,如果我们可以从输出恢复输入,我们便认为输出与输入相关。但在一些生成场景下,这从输出恢复输入并不自然,因此我们使用连续反向提示来缓解这一现象。我们在输出两端添加连续反向提示  ,并建模输出到输入的概率:    我们期望反向提示可以更好地反映输出到输入的关系,这更多取决于任务本身,因此这里的反向提示是静态的。   最后,我们结合语境提示和连续反向提示,选择联合概率最大的生成文本:    3.轻量化语境调优 考虑到我们的语境提示引入了两个预训练模型,我们使用了一种轻量化微调方法BifFit,即仅微调每个参数的bias项,最终我们仅需要微调全量模型0.12%的参数。因此,我们在实验中考虑了全量微调和轻量化微调两种场景。 三、实验 为了验证语境调优的有效性,我们在四个开放式文本数据集上进行了测试:WritingPrompts,ROCStories,ChangeMyReivew和WikiPlots。 我们考虑了六个基线方法(其中前四个用于全量微调,后两个用于轻量化微调):

通用文本生成模型:BART,GPT-2和T5;

专为故事生成设计的方法:HINT;

轻量化方法:Prefix-tuning和Prompt tuning

同时,我们使用BLEU来衡量生成文本的质量,用Distinct来评价生成文本的多样性。 618fbf8c-4ade-11ed-a3b6-dac502259ad0.jpg   实验结果表明我们在全量微调和轻量化微调两种场景下均优于基线模型,其中轻量化模型在仅微调0.12%参数的情况下可以达到全量微调98%的表现。 61a4bff4-4ade-11ed-a3b6-dac502259ad0.jpg   消融实验中,我们尝试替换语境提示、删除语义对齐或反向提示,生成结果均有下降,这验证了我们语境提示和连续反向提示的有效性。   61bf75f6-4ade-11ed-a3b6-dac502259ad0.jpg   人工评价表明,使用语境调优生成的文本在流畅性、信息量、相关性和一致性上均优于基线模型,且有82.83%的生成文本被认为是人所写的。   61dc289a-4ade-11ed-a3b6-dac502259ad0.jpg   四、总结 6222a612-4ade-11ed-a3b6-dac502259ad0.jpg   本文提出了用于自然语言生成的“语境调优”技术:  

我们提出“语境提示”,增强生成文本的信息量;

我们使用“连续反向提示”,增强生成文本的相关性;

我们提出轻量化微调语境调优,仅微调0.12%的参数却能保持98%的性能。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6986

    浏览量

    88931
  • 模型
    +关注

    关注

    1

    文章

    3217

    浏览量

    48801
  • 深度学习
    +关注

    关注

    73

    文章

    5497

    浏览量

    121092
  • 自然语言
    +关注

    关注

    1

    文章

    287

    浏览量

    13346

原文标题:COLING'22 | 如何增强文本生成的信息量和相关性?基于语境提示的生成方法Context-Tuning

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自然语言处理包括哪些内容 自然语言处理技术包括哪些

    Classification and Clustering):将文本按照相似性进行分类或聚类。 信息提取(Information Extraction):从文本中提取有用的信息。 自然语言生成(Natural Language Generation):
    的头像 发表于 08-03 16:22 7127次阅读

    python自然语言

    最近,python自然语言是越来越火了,那么什么是自然语言自然语言(Natural Language )广纳了众多技术,对自然或人类
    发表于 05-02 13:50

    自然语言处理怎么最快入门?

    `本文整理自知乎上的一个问答,分享给正在学习自然语言处理的朋友们!一、自然语言处理是什么?自然语言处理说白了,就是让机器去帮助我们完成一些语言
    发表于 11-28 10:02

    【推荐体验】腾讯云自然语言处理

    `相信大家对NLP自然语言处理的技术都不陌生,它是计算机科学领域和AI领域中的一个分支,它与计算机和人类之间使用自然语言进行交互密切相关,而NLP的最终目标是使计算机能够像人类一样理解语言
    发表于 10-09 15:28

    自然语言处理的语言模型

    自然语言处理——53 语言模型(数据平滑)
    发表于 04-16 11:11

    什么是自然语言处理

    什么是自然语言处理?自然语言处理任务有哪些?自然语言处理的方法是什么?
    发表于 09-08 06:51

    自然语言处理怎么最快入门_自然语言处理知识了解

    自然语言处理就是实现人机间自然语言通信,实现自然语言理解和自然语言生成是十分困难的,造成困难的根本原因是
    发表于 12-28 17:10 5307次阅读

    自然语言处理的概念和应用 自然语言处理属于人工智能吗

      自然语言处理(Natural Language Processing)是一种人工智能技术,它是研究自然语言与计算机之间的交互和通信的一门学科。自然语言处理旨在研究机器如何理解人类
    发表于 08-23 17:31 1483次阅读

    什么是自然语言处理 (NLP)

    理解和处理自然语言文本,从而实现人机交互的流畅和自然。NLP不仅关注理论框架的建立,还侧重于实际技术的开发和应用,广泛应用于法律、医疗、教育、安全、工业、金融等多个领域。
    的头像 发表于 07-02 18:16 1123次阅读

    自然语言处理包括哪些内容

    自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个重要分支,它涉及到计算机与人类语言之间的交互。NLP的目标是让计算机能够理解、生成和处理人类
    的头像 发表于 07-03 14:15 800次阅读

    自然语言处理是什么技术的一种应用

    自然语言处理(Natural Language Processing,简称NLP)是人工智能和语言学领域的一个分支,它涉及到使用计算机技术来处理、分析和生成
    的头像 发表于 07-03 14:18 765次阅读

    自然语言处理技术的核心是什么

    自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个重要分支,其核心目标是使计算机能够理解、生成和处理人类语言。NLP技术的发展已经取
    的头像 发表于 07-03 14:20 690次阅读

    自然语言处理技术有哪些

    自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个分支,它致力于使计算机能够理解、解释和生成人类语言自然语言处理
    的头像 发表于 07-03 14:30 1061次阅读

    使用LLM进行自然语言处理的优缺点

    自然语言处理(NLP)是人工智能和语言学领域的一个分支,它致力于使计算机能够理解、解释和生成人类语言。大型语言模型(LLM)是NLP领域的一
    的头像 发表于 11-08 09:27 403次阅读

    自然语言处理与机器学习的关系 自然语言处理的基本概念及步骤

    自然语言处理(Natural Language Processing,简称NLP)是人工智能和语言学领域的一个分支,它致力于研究如何让计算机能够理解、解释和生成人类语言。机器学习(Ma
    的头像 发表于 12-05 15:21 436次阅读