0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

万能的prompt还能做可控文本生成

深度学习自然语言处理 来源:夕小瑶的卖萌屋 作者:ZenMoore 2022-03-22 10:54 次阅读

可控文本生成,旨在让语言模型的输出带有我们想要的某种属性。比如情感、主题、三元组等。一般我们习惯采用 CTRL[1] 或者 PPLM[2] 等方式。但是,CTRL 是对整个语言模型进行 Finetuning, PPLM 因为需要在生成的过程中迭代更新 hidden activations,所以推理速度非常慢。

随着 Prompting 技术的大火,我们一直在思考,Prompt 究竟能够带来什么?我们都说,Prompt 本质上是一种激发语言模型中知识的手段。因此,它应该不仅仅局限于数据集或者说任务的层面,激发模型对于某个任务的“知识”,还应该扩展到范围更广的控制属性层面,激发模型对于某种输出属性的 sense !

于是,我们不妨把视角从 task scaling 挪开,更多地关注一下 Prompt 对于可控性的 buff 加成。

今天的这篇文章来自 UCSB 和微软,提出通过对比学习的方法找寻到了这个 buff 一般的 Prompt,能够“调教”我们的语言模型进行可控的生成。

论文标题:
Controllable Natural Language Generation with Contrastive Prefixes

论文作者:
Jing Qian, Li Dong, Yelong Shen, Furu Wei, Weizhu Chen

论文链接:
https://arxiv.org/abs/2202.13257

模型方法

首先明确一个概念:Prefix。读者可以简单看一下 Prefix-Tuning[3] 的方法图,就大概知道:Prefix 相当于一种控制指令,加在输入的最前面,以控制生成文本的属性。

cf491344-a8da-11ec-952b-dac502259ad0.png

本文提出了两种方法,分别是监督方法和无监督方法。

下面的方法介绍以 Sentiment Control 为例(即生成给定带有情感的文本)。该任务要训练的,正是 positive 和 negative 的两种情感类别所对应的 prefix.

监督方法

cf68b528-a8da-11ec-952b-dac502259ad0.png

整个训练过程和 Prefix-Tuning[3] 相似,LM 的参数是冻结的,只调整 Prefix 相关联的参数。在训练的时候,除了LM loss 之外,新增一个判别损失:

其中, 代表生成文本, 代表控制信号的类别(positive 或 negative)。

无监督方法

在监督方法中,控制信号是已知的。实际场景中还会常常出现控制信号未知的情况,因此需要通过变分的无监督方法找到这个“虚拟的类别信号“并使用 latent variable 表征,即 VQ-VAE[4] 的思想。

cf9bff00-a8da-11ec-952b-dac502259ad0.png

如图,需要先通过一个 encoder 预测相应输入对应的 latent variable 作为 prefix index(指代当前要使用哪个 prefix)。设 prefix index 为 ,则这个 encoder 就是要学习 这个分布。

一方面,除了 LM loss ,还需要保证后验概率 或 尽可能的准确,故引入 KL 散度:

这里的 假设是 uniform distribution。其中,

GS 表示 Gumbel Softmax, 是 GS 的 temperature 参数。

关于这块儿的详细原理,就是我们小学二年级就学过的 EM 算法啦~

帮读者回忆一下:

......

另外,作者又提出了一个无监督对比损失:其中, 和 是根据 decoder 的文本生成概率得到的,具体计算方式如下:

最后总的损失函数为 ,, 的加权求和,

实验结果

Sentiment Control

cfb4baae-a8da-11ec-952b-dac502259ad0.png

Detoxification

cfd7c936-a8da-11ec-952b-dac502259ad0.png

Topic Control

d006265a-a8da-11ec-952b-dac502259ad0.png

推理速度

d036c26a-a8da-11ec-952b-dac502259ad0.png

Multi-Aspect Control

实际场景中,很少有 multi-aspect labeled data,只有 single-aspect labeled data.

本文使用了两种方式来解决多种属性的可控生成问题:

Ours (concatenation):使用 single-aspect labeled data 分别训练各自的 prefix, 然后在 multi-aspect control 任务中将其拼接起来。

Ours (semi-supervised):同时训练 multi-aspect prefixes, 在训练时把 single-aspect labeled example 当做 partially labeled. 此外,multi-aspect prefixes 经过了 trained single-aspect prefixes 的初始化。

Ours (semi-supervised) 是上述监督方法和无监督方法的组合,因此架构图和无监督方法的图是一样的。

d04eca36-a8da-11ec-952b-dac502259ad0.png

写在最后

这里也推荐读者品读一下 DeepMind & ICL 的相似工作:Control Prefixes [5].

古人云:“君子生非异也,善假于物也”。我们把语言模型比作“人”,把可控性比作“物”,也许,大大小小的语言模型在能力的本质上并没有什么不同,但是如果可以通过不同的 Control Prefixes,假之以物,则语言模型可成“君子”也!(哈哈,搞一个俏皮的比喻~)

无论是本文介绍的 Contrastive Prefixes 也好,还是 Control Prefixes 也好,我们都可以从中发现 Prompt 对于”调教“语言模型的伟大能力。从 task 到 controllability, 可能会是 prompt 向前发展的又一个新阶段吧~

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    527

    浏览量

    10283
  • prompt
    +关注

    关注

    0

    文章

    14

    浏览量

    2680

原文标题:搭配对比学习,万能的 prompt 还能做可控文本生成

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电子万能试验机与液压万能试验机的区别

      电子万能材料试验机主要采用伺服电机作为动力源,丝杠、丝母作为执行部件,实现试验机移动横梁的速度控制。在传动控制上,目前主要有两种形式,同步带 和减速机。国内来说,长春地区的试验机厂家多采用同步带
    发表于 07-04 16:06

    中星微万能驱动下载

    中星微万能驱动下载
    发表于 01-11 23:02 19次下载
    中星微<b class='flag-5'>万能</b>驱动下载

    winxp万能声卡驱动,程序下载

    winxp万能声卡驱动 尊敬的用户,本万能
    发表于 04-21 19:23 538次下载
    winxp<b class='flag-5'>万能</b>声卡驱动,程序下载

    万能遥控器设置方法_万能遥控器代码

    电视是每个家庭必不可少的家用电器,所以我们在使用遥控器的时间也会比较多。但如果遥控器换了怎么办,很多人都会想到配一个万能遥控器,那么万能遥控器怎么设置,它的万能
    发表于 09-14 18:08 18.8w次阅读
    <b class='flag-5'>万能</b>遥控器设置方法_<b class='flag-5'>万能</b>遥控器代码

    万能钥匙字典生成工具.exe

    电子发烧友网站提供《万能钥匙字典生成工具.exe.exe》资料免费下载
    发表于 04-09 19:43 4次下载

    万能协议通信工具

    万能协议通信工具分享
    发表于 11-18 11:47 14次下载

    万能转换开关原理_万能转换开关结构

    本文首先阐述了万能转换开关原理,其次介绍了万能转换开关技术特点,最后介绍了万能转换开关结构。
    发表于 12-09 10:16 1w次阅读

    万能转换开关选型_万能转换开关使用

    本文主要介绍了万能转换开关选型方法及万能转换开关的使用。
    发表于 12-09 10:30 4367次阅读

    文本生成任务中引入编辑方法的文本生成

    4. FELIX FELIX是Google Research在“FELIX: Flexible Text Editing Through Tagging and Insertion”一文中提出的文本生成
    的头像 发表于 07-23 16:56 1744次阅读
    <b class='flag-5'>文本生成</b>任务中引入编辑方法的<b class='flag-5'>文本生成</b>

    受控文本生成模型的一般架构及故事生成任务等方面的具体应用

    来自:哈工大讯飞联合实验室 本期导读:本文是对受控文本生成任务的一个简单的介绍。首先,本文介绍了受控文本生成模型的一般架构,点明了受控文本生成模型的特点。然后,本文介绍了受控文本生成
    的头像 发表于 10-13 09:46 3547次阅读
    受控<b class='flag-5'>文本生成</b>模型的一般架构及故事<b class='flag-5'>生成</b>任务等方面的具体应用

    基于GPT-2进行文本生成

    文本生成是自然语言处理中一个重要的研究领域,具有广阔的应用前景。国内外已经有诸如Automated Insights、Narrative Science以及“小南”机器人和“小明”机器人等文本生成
    的头像 发表于 04-13 08:35 4776次阅读

    基于VQVAE的长文本生成 利用离散code来建模文本篇章结构的方法

    写在前面 近年来,多个大规模预训练语言模型 GPT、BART、T5 等被提出,这些预训练模型在自动文摘等多个文本生成任务上显著优于非预训练语言模型。但对于开放式生成任务,如故事生成、新闻生成
    的头像 发表于 12-01 17:07 1748次阅读

    基于文本到图像模型的可控文本到视频生成

    文本到视频模型需要大量高质量的视频和计算资源,这限制了相关社区进一步的研究和应用。为了减少过度的训练要求,我们研究了一种新的高效形式:基于文本到图像模型的可控文本到视频
    的头像 发表于 06-14 10:39 971次阅读
    基于<b class='flag-5'>文本</b>到图像模型的<b class='flag-5'>可控</b><b class='flag-5'>文本</b>到视频<b class='flag-5'>生成</b>

    面向结构化数据的文本生成技术研究

    今天我们要讲的文本生成是现在最流行的研究领域之一。文本生成的目标是让计算机像人类一样学会表达,目前看基本上接近实现。这些突然的技术涌现,使得计算机能够撰写出高质量的自然文本,满足特定的需求。
    的头像 发表于 06-26 14:39 641次阅读
    面向结构化数据的<b class='flag-5'>文本生成</b>技术研究

    如何使用 Llama 3 进行文本生成

    使用LLaMA 3(Large Language Model Family of AI Alignment)进行文本生成,可以通过以下几种方式实现,取决于你是否愿意在本地运行模型或者使用现成的API
    的头像 发表于 10-27 14:21 424次阅读