对比解码在LLM上的应用

深度学习自然语言处理原创

作者：wkk

为了改进LLM的推理能力，University of California联合Meta AI实验室提出将Contrastive Decoding应用于多种任务的LLM方法。实验表明，所提方法能有效改进LLM的推理能力。让我们走进论文一探究竟吧！

对比解码(Contrastive Decoding)

在走进论文之前首先介绍一下什么是对比解码，其是由Li等人在2022年提出的一种文本生成方法，具有简单、计算量小、训练自由等特点。它通过查找到最大化强模型和弱模型之间可能性差异的字符串来生成文本，从而产生更多且更高质量的文本。在对比解码中，弱模型可以是常规的贪心解码方法，如一些简单的采样方法，强模型可以是经过训练的大型语言模型。对比解码可以在很多推理任务上表现出色，包括算术推理和多项选择排名任务，可以提高语言模型的准确率。

本文创新点：探索对比解码在LLM上的应用。具体地，通过最大化专家模型和较弱的业余模型之间存在的可能性误差(如下图所示)来搜索字符串，避免了专家模型中的不良影响和贪婪解码会出现的采样误差问题。

实验结论：通过在多种任务上的测试，本文证明了对比解码可以提高大型语言模型在推理和文本生成问题上的性能，这是第一种同时在推理和文本生成问题上实现最先进结果的生成算法。此外，还分析了对比解码的改进原因，并探讨了该方法在常识推理和事实检索方面的适用性。

实验

实验设置

模型：实验采用LLaMA家族的原始模型，其中专家模型为LLaMA-65B，业余模型为具有1.5B的LLaMA模型。此外，在消融实验中，本文还对FLAN-T5家族的模型进行实验分析。

解码参数：α=0.1，为原始论文中相同的超参数：专家模型分配的最大概率的比例，任何标记都分配了较低的概率被屏蔽掉。β=0.5是对应于业余惩罚强度的超参数。将前导 (1 + β) 系数包含在专家 logits 中，以将对比惩罚的强度与输出 logits 的预期尺度解耦，描述了用于采样的温度的对比权衡之间的对比权衡。

prompt：对于生成任务使用8-shot的CoT。

数据集：聚焦代数问题的AQuA、ASDiv、GSM8K、SVAMP和MATH数据集，针对常识推理的CommonsenseQA、StrategyQA数据集以及AI2 Reasoning Challenge、BooIQ、HellaSwag、MMLU、PIQA、SIQA和WinoGrande等基准数据集。

实验结果

在GSM8K上的实验表明，β=0.5能获得更好的结果同时业余模型对于性能的提升可能大于专家模型。

对比解码往往有助于全面完成具有CoT提示的算术推理任务。其中一个例外是MATH数据集，它被证明对标准解码和对比解码都具有挑战性。作者推测因为对比解码放大了专家比业余模型学得更好的技能，所以它对远远超出专家模型的任务没有帮助。

在CommonsenseQA和StrategyQA数据集上实验发现对比解码会损害较小模型的性能。

对比解码的影响

本文还进行了一系列附加实验，研究表明，对比解码可以在大型语言模型中提高推理能力。在算术推理和多项选择排名任务上，包括LLaMA-65B这样的大型模型，都有普遍的改进，这表明对比解码可以使更大的模型受益。通过分析对比解码改进的原因。实证表明，与贪婪解码相比，对比解码从提示中复制的表面层次较少，错过的推理步骤也较少。这一结果表明，对比解码通过减少模型分布中的短、重复或其他不良模式来起作用。

结论

使用对比解码（Contrastive Decoding）方法可以显著提高大型语言模型在一系列推理任务中的准确性，这种方法不仅在生成文本方面表现优异，还可以在推理问题方面超越当前现有的各种模型。同时，该方法能够减少模型分布中的短、重复或其他不良模式，从而提高模型的推理能力。然而，该方法在常识推理任务中表现良莠不齐，需要进一步研究和改进。总的来说，对比解码方法在改善语言模型的生成和推理能力上具有广泛的应用前景。

审核编辑：汤梓红

阅读全文

解码(27094) 解码(27094)
AI(263628) AI(263628)
深度学习(119798) 深度学习(119798)
自然语言处理(13090) 自然语言处理(13090)
LLM(229) LLM(229)

【比特熊充电栈】实战演练构建LLM对话引擎

大模型时代，安全问题不容小觑。但如果把大模型比作孙悟空，那 NVIDIA NeMo Guardrails 就是“安全护栏”，可以轻松的为基于 LLM 的对话系统添加可编程护栏，来避免大语言模型输出

2023-09-19 13:40:04

717

突破边界：高性能计算引领LLM驶向通用人工智能AGI的创新纪元

ChatGPT的成功带动整个AIGC产业的发展，尤其是LLM（大型语言模型，大语言模型）、NLP、高性能计算和深度学习等领域。LLM的发展将为全球和中国AI芯片、AI服务器市场的增长提供强劲动力，据估算，LLM将为全球和中国AI服务器带来约891.2亿美元和338.2亿美元的市场空间。

2023-06-25 14:31:15

575

TensorRT-LLM初探（一）运行llama

TensorRT-LLM正式出来有半个月了，一直没有时间玩，周末趁着有时间跑一下。

2023-11-16 17:39:34

772

基于ICL范式的LLM的最高置信度预测方案

本文假设不同的ICL为LLM提供了关于任务的不同知识，导致对相同数据的不同理解和预测。因此，一个直接的研究问题出现了:llm能否用多个ICL提示输入来增强，以提供最可信的预测？为解决这个问题，本文提出上下文采样(ICS)。ICS遵循三步流程:采样、增强和验证，如图1所示。

2023-11-24 11:20:46

863

低比特量化技术如何帮助LLM提升性能

针对大语言模型 (LLM) 在部署过程中的性能需求，低比特量化技术一直是优化效果最佳的方案之一，本文将探讨低比特量化技术如何帮助 LLM 提升性能，以及新版 OpenVINO 对于低比特量化技术的支持。

2023-12-08 15:26:45

554

使用基于Transformers的API在CPU上实现LLM高效推理

英特尔 Extension for Transformers是英特尔推出的一个创新工具包，可基于英特尔架构平台，尤其是第四代英特尔至强可扩展处理器（代号 SapphireRapids，SPR）显著加速基于Transformers的大语言模型( LargeLanguageModel,LLM)。

2024-01-22 11:11:06

1823

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

在AT32微控制器上实现基于Zbar解码库的QR Decode应用程序

本应用笔记的目的是提供在AT32微控制器上实现基于Zbar解码库的QR Decode应用程序的一般方法。

2023-10-26 08:07:21

在FPGA上h.264视频编解码的实现

想在DE2-115的开发板上完成h.264视频编解码，自己的想法是在已有的tpad_camer代码上加一软核，但一直失败，希望有相关经验的高手指点下？

2014-03-05 16:24:19

在RK3288主板Debian 9.13系统上如何调用CPU硬解进行网络摄像头视频流解码？

2022-03-03 06:47:08

在TMS320C6657器件上轻松运行经TI 优化的Opus编码器/解码器

适用于语音通信、联网音频甚至高性能音频处理应用。较之 ARM 等通用处理器，此设计还通过在 DSP 上实现 Opus 编解码器来提升性能。根据通用处理器上所运行代码的优化级别，通过在 C66x TI

2022-09-22 06:32:42

AMBA解码器产品手册

以作为一个简单的保护单元，防止试图访问存储器映射的非法或受保护区域。提供了该解码器的两种实现： ·带译码周期的译码。这是默认型号。此实现会自动插入一个解码周期： -在非顺序传输开始时-在断言BLAST时在顺序传输上-当达到1KB内存边界时

2023-08-22 06:26:05

AVS与其他主要主要编解码技术对比

AVS与其他主要主要编解码技术对比编码工具AVSH.264MPEG2帧内预测基于8*8块，5种亮度预测模式，4种色度预测模块基于4*4块，9种亮度预测模式，4种色度预测模式只有频域内进行DC系数差分

2011-02-13 20:34:47

Blast Extreme会卸载端点GPU上的解码吗？

大家好，我对Horizon 7的好处感到非常兴奋 -Blast Extreme能够将编码卸载到GPU上。这是否也允许将解码卸载到端点上的GPU？或者解码仍然发生在CPU中？谢谢！理查德以上

2018-09-30 10:45:06

CH32V103的AB相编码器正交解码，数据少一半是为什么？

如题，我将CH32V103的正交解码功能引脚与光栅尺的AB相输出相连（例如TIM3的PC6 PC7引脚）并编程开启正交解码功能，通过串口发送至PC查看数据。AB相正交解码应该是在AB两相的四个信号

2022-06-09 07:37:19

DM8168在DVRRDK上的应用咨询

、在第3、4点的基础上，如果输入是两路H.264码流，能否实现这两路信号的任意混叠后再输出。 6、使用两个DM8168分别解码一个DM8168编码后的码流，这两个解码DM8168输出的图像能否做到同步

2018-05-31 08:59:04

FPGA对比STM32在解码方面有什么优势？

为什么FPGA在解码方面用的更多

2023-10-30 08:52:22

GM7150 视频解码芯片国腾电子

源选择、A/D 转换、自动钳位、自动增益控制（AGC）、时钟发生（CGC）、多制式解码、亮度/对比度/饱和度控制（BCS）。在噪点处理上比TVP5150效果更好，军工工艺，性价比更高。

2013-12-16 13:30:47

H264解码器h264hpvdec修改为实时解码,请问应该从何处修改？

insufficient to decode a picture)的错误，即解码第二个P帧时没有将SPS包、PPS包和I帧的数据用起，TI的解码器库是否具有在解码新的一帧时利用解码上一帧用到的H264码流的特性？

2018-08-03 08:43:02

MP3解码芯片

中人们仍然习惯性地称它们为“解码芯片”。2 MP3解码芯片作用　　MP3解码芯片的作用顾名思义就是将存储在介质上的MP3文件解码。它是MP3工作中最重要的一环，很大程度上影响最终的音质表现。MP3

2016-12-14 14:16:35

MP3解码芯片的原理是什么？

MP3解码芯片的作用顾名思义就是将存储在介质上的MP3文件解码。它是MP3工作中最重要的一环，很大程度上影响最终的音质表现。MP3是一种有损压缩的格式，如果MP3播放器拥有优秀的解码芯片就能够更好

2019-10-25 09:13:36

MTK解码芯片对比表

MTK解码芯片对比表General Features For Amoi OnlyChip Version 79 89B 89C 89D 89E 89HDVideo compression MPEG

2008-08-05 12:46:31

PAL制解码电路及系统

, 到达解码矩阵的时间就不相同而使重现的图像出现彩色镶边现象。为此, 应在亮度通道中设置延时电路。   第四, 视频全电视信号若失去直流分量, 在黑白电视机中仅改变

2010-10-01 17:10:34

STM32的音频编码与在PC端的解码简介

STM32的音频编码与在PC端的解码简介STM32F4移植编码PC移植解码结尾简介能看到这篇文章的基本上都是有迫切需求的人，话不多说，切入正题编解码库：Speex编码硬件平台：STM32F411

2021-08-12 07:45:40

TDA8376解码集成电路资料推荐

TDA8376是飞利蒲公司生产的解码集成电路，内部包括：P/N制式色度解码、亮度处理、同步处理、RGB控制、偏转控制。在TCL 3498GH机型上测定序号符号功能。

2021-05-07 06:52:38

mp3软件音频解码实现语音播报功能

最近做了一个无人机的语音播放项目，查了一下网上大部分都是硬件解码，成本相对比较高，而为了节约成本，我们采用了stm32f446 RET6作为主控+tas5720作为dac功放，实现mp3软件音频解码

2021-08-12 07:56:45

【原创】对bmp格式2位黑白图片解码并显示在12864液晶上

` 本帖最后由 gtbestom 于 2014-4-15 10:58 编辑最近移植成功了fat32文件系统，还认真学习了bmp文件格式，对bmp文件进行了解码，黑白12864液晶屏只能到这样的显示效果了，只对黑白两色位图进行解码，还算成功~^_^新手请大家多多包涵。`

2014-04-07 16:49:03

关于嵌入式DSP上的视频编解码的知识点总结的太棒了

2021-06-08 06:49:22

可配置兼容多标准的视频解码器片上系统

可配置兼容多标准的视频解码器片上系统世界视频设备市场已经进入从模拟设备向数字设备的转型期,这个为期十年的历史性转折将引发巨大的市场需求。与模拟技术相比，视频的数字化技术可以提高图像的清晰度和质量，并

2009-10-06 09:58:54

如何基于ffmpeg在ubuntu系统上添加硬解支持

firefly-rk3288 linux上H264、H265解码一直都是软解，下面将介绍如何基于ffmpeg，在ubuntu系统上添加硬解支持，首先安装硬解驱动库。这里使用的是国外友人mac_l1

2022-06-14 09:30:16

应用AM3358，请问怎样在硬件设计上外部连接解码器芯片，实现对图像数据的解码？

本帖最后由一只耳朵怪于 2018-6-5 14:46 编辑图像数据由网口发送给AM3358，需要解码，现在想通过外部连接解码器芯片来实现，可是看了下手册，不太清楚ARM由哪些端口可以连接解码器芯片，请高手指教一下，谢谢

2018-06-04 15:35:57

开博尔q30plus音频解码再进一步

纪念版q10plus基础上做了众多升级。从用户反馈意见和综合口碑来看，开博尔q10plus已经是极其成熟的旗舰播放器，无论在UHD画质还是在无损音乐解码上都达到了行业顶尖水平。而开博尔官方似乎并不满足现状，本月郑重

2018-08-29 20:45:23

怎么在硬件上实现红外信号解码器

能在硬件上实现红外信号解码器吗？或者我应该只产生一个中断信号的下降沿，然后解码所有的软件吗？我已经在不同的项目做了好几次，而使用传统的微处理器和软件做这一切。我主要只是计数增量（信号保持高或低的时间

2019-02-14 14:35:23

振南真正实现ADPCM音频解码与播放【为了边解码边播放的流畅度，振南提出了“追随策略”！】

到PC，存为WAV文件，通过播放器软件来播放。总之，不论是使用VS1003去回放它，还是用PC上的播放器软件来播放WAV文件，都是使用外部的解码器（硬件或者软件）对ADPCM进行解码的。但是在实际

2016-06-17 14:40:28

电路双口网络的参数矩阵实测值和理论值怎样进行对比？对比的重点在哪里？

在实际测量得到的双口网络的T参数，和理论上的T参数矩阵，该怎样进行对比。两者均为2*2矩阵。求解。

2016-12-22 18:11:46

示波器全内存解码的奥秘

我们知道，协议解码是协议分析中一个很重要的功能，它的实用程度取决于解码的准确性、解码范围和解码速度，其中解码范围和解码速度是一对矛盾，二者很难兼得。在以往的解码方案中，我们将解码范围限制在一定宽度

2016-11-27 22:31:23

红外解码在电脑上显示

请大家看看为什么在电脑上不能显示呢？想法是这样的：按下红外遥控器的按钮后，其码值显示到电脑上#include#define uchar unsigned char#define uint

2013-10-28 19:07:03

红外遥控解码

红外要控解码 1602上显示红外遥控编码

2012-08-13 18:00:11

红外遥控解码程序问题

话很不理解：IRCOM[j]=IRCOM[j] >> 1; //高位补0按照程序的思路，解码后的值就存储在 IRCOM[2] 里面，然后跟键码表RecvData[] 进行对比：for(j=0

2017-06-10 16:42:53

请问TC9012红外解码的值如何确定？

在好多TC9012红外解码的程序中，有看到0x0C 对应遥控器上的 0；0X18对应遥控器上的 1，我想知道这个0x0C 0X18 等解码后的值是怎么确定的呢？、

2019-06-05 04:35:39

请问TI有提供可以在6437上直接调用的MPEG2,MPEG4或者H.264视频编解码库吗？

本帖最后由一只耳朵怪于 2018-6-25 14:21 编辑各位专家：我想知道TI是否有提供可以在6437上直接调用的MPEG2,MPEG4或者H.264视频编解码库，如果有的话，如何获取，没有的话，是否有第三方提供？

2018-06-25 07:28:30

请问dm365可以实现接收网络上的数据流在本地解码吗？

本帖最后由一只耳朵怪于 2018-5-25 15:21 编辑 dm365可以实现接收网络上的数据流在dm365上解码吗，貌似demo的decode程序只能解码TI编码的h264或mpeg4

2018-05-25 00:46:28

请问如何控制解码器解码的速度呢

请问如何控制解码解码的速度，我发现在解码过程中添加延时会导致解码器错误线程A 往mpp解码器送数据调用函数decode_put_packet（ffmpeg 拉流）线程B 解码数据调用函数

2022-09-15 16:05:48

超级电容与电池对比具有哪些明显的特性？

超级电容与电池对比具有哪些明显的特性？超级电容在智能电表上的应用是什么？

2021-10-13 08:05:23

为什么需要视频编码，它的原理又是什么？第二集#视频编解码 #视频编解码

解码编解码视频技术

面包车发布于 2022-07-29 15:12:56

这款模块不带解码芯片使用需要配合编码芯片和解码芯片才可以正常使用！！！ #硬声创作季

fpga芯片解码解码芯片

Hello,World!发布于 2022-09-28 10:32:31

LH3565彩色解码电路的应用电路图

LH3565是一块单片PAL彩色解码集成电路,它能产生R,G,B三种信号直接输出,并能控制亮度,对比度和色饱和度.应用实例

2010-10-10 10:16:41

2763

音频解码

橙群微电子发布于 2023-03-16 10:00:34

IPTV视频编解码标准的对比与选择

关键词：IPTV , 编解码 , 视频 1、引言 IPTV业务是指基于宽带互联网与宽带接入，以机顶盒或其它具有视频编解码能力的数字化设备作为终端，通过聚合SP的各种流媒体服务内容和增值应用，为用户

2019-01-03 17:04:01

910

如何利用LLM做多模态任务？

大型语言模型LLM（Large Language Model）具有很强的通用知识理解以及较强的逻辑推理能力，但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力，但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此，现阶段，如何利用LLM做一些多模态任务还是有一定的研究价值的。

2023-05-11 17:09:16

648

如何利用LLM做一些多模态任务

本文整理了近两年来基于LLM做vision-lanuage任务的一些工作，并将其划分为4个类别：

2023-05-17 15:02:35

575

邱锡鹏团队提出具有内生跨模态能力的SpeechGPT，为多模态LLM指明方向

大型语言模型（LLM）在各种自然语言处理任务上表现出惊人的能力。与此同时，多模态大型语言模型，如 GPT-4、PALM-E 和 LLaVA，已经探索了 LLM 理解多模态信息的能力。然而，当前

2023-05-22 14:38:06

417

LLM性能的主要因素

现在是2023年5月，截止目前，网络上已经开源了众多的LLM，如何用较低的成本，判断LLM的基础性能，选到适合自己任务的LLM，成为一个关键。本文会涉及以下几个问题：影响LLM性能的主要因素

2023-05-22 15:26:20

1148

如何利用LLM做多模态任务？

大型语言模型LLM（Large Language Model）具有很强的通用知识理解以及较强的逻辑推理能力，但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力，但目前还未开放多模态输入接口

2023-05-22 15:57:33

466

如何最好地使用所有可用的 LLM 工具

鉴于价格和质量的广泛差异，从业者可能很难决定如何最好地使用所有可用的 LLM 工具。此外，如果服务中断，则依赖单个 API 提供者是不可靠的，这可能发生在意外高需求的情况下。

2023-05-23 17:22:30

525

LLM在各种情感分析任务中的表现如何

最近几年，GPT-3、PaLM和GPT-4等LLM刷爆了各种NLP任务，特别是在zero-shot和few-shot方面表现出它们强大的性能。因此，情感分析(SA)领域也必然少不了LLM的影子

2023-05-29 17:24:41

1379

大型语言模型（LLM）的自定义训练：包含代码示例的详细指南

近年来，像 GPT-4 这样的大型语言模型（LLM）因其在自然语言理解和生成方面的惊人能力而受到广泛关注。但是，要根据特定任务或领域定制LLM，定制培训是必要的。本文提供了有关自定义训练 LLM 的详细分步指南，其中包含代码示例和示例。

2023-06-12 09:35:43

1782

Macaw-LLM：具有图像、音频、视频和文本集成的多模态语言建模

尽管指令调整的大型语言模型 (LLM) 在各种 NLP 任务中表现出卓越的能力，但它们在文本以外的其他数据模式上的有效性尚未得到充分研究。在这项工作中，我们提出了 Macaw-LLM，一种新颖的多模式 LLM，它无缝集成了视觉、音频和文本信息。

2023-06-19 10:35:33

876

基于Transformer的大型语言模型（LLM）的内部机制

本文旨在更好地理解基于 Transformer 的大型语言模型（LLM）的内部机制，以提高它们的可靠性和可解释性。随着大型语言模型（LLM）在使用和部署方面的不断增加，打开黑箱并了解它们的内部

2023-06-25 15:08:49

991

基于一个完整的 LLM 训练流程

在这篇文章中，我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练（Pretrain）、Tokenizer 训练、指令微调（Instruction Tuning）等环节。文末

2023-06-29 10:08:59

1202

最新综述！当大型语言模型（LLM）遇上知识图谱：两大技术优势互补

LLM 是黑箱模型，缺乏可解释性，因此备受批评。LLM 通过参数隐含地表示知识。因此，我们难以解释和验证 LLM 获得的知识。此外，LLM 是通过概率模型执行推理，而这是一个非决断性的过程。对于 LLM 用以得出预测结果和决策的具体模式和功能，人类难以直接获得详情和解释。

2023-07-10 11:35:00

1354

适用于各种NLP任务的开源LLM的finetune教程~

ChatGLM2-6b是清华开源的小尺寸LLM，只需要一块普通的显卡(32G较稳妥)即可推理和微调，是目前社区非常活跃的一个开源LLM。

2023-07-24 09:04:22

1311

LLM对程序员的冲击和影响

LLM 对软件研发的单点提效，我之前录制过一段视频，大家可以直接观看，里面有详细的演示，我在这里就不再赘述了。

2023-07-24 15:39:06

766

LLM的长度外推浅谈

苏神最早提出的扩展LLM的context方法，基于bayes启发得到的公式

2023-07-28 17:37:43

1484

MLC-LLM的编译部署流程

MLC-LLM部署在各种硬件平台的需求，然后我就开始了解MLC-LLM的编译部署流程和RWKV World模型相比于MLC-LLM已经支持的Raven系列模型的特殊之处。 MLC-LLM的编译部署流程

2023-09-04 09:22:46

1569

检索增强LLM的方案全面的介绍

分分享了 ChatGPT 这类模型是如何一步一步训练的，后半部分主要分享了 LLM 模型的一些应用方向，其中就对检索增强 LLM 这个应用方向做了简单介绍。

2023-09-08 16:39:55

799

mlc-llm对大模型推理的流程及优化方案

在 MLC-LLM 部署RWKV World系列模型实战（3B模型Mac M2解码可达26tokens/s）中提到要使用mlc-llm部署模型首先需要一个编译过程，将原始的基于Realx搭建的模型

2023-09-26 12:25:55

383

Continuous Batching：解锁LLM潜力！让LLM推断速度飙升23倍，降低延迟！

本文介绍一篇 LLM 推理加速技术相关的文章，值得读一读。 LLMs 在现实应用中的计算成本主要由服务成本所主导，但是传统的批处理策略存在低效性。在这篇文章中，我们将告诉

2023-10-15 20:25:02

292

在线研讨会 | 基于 Jetson 边缘计算平台构建 Azure OpenAI LLM 安全护栏

NVIDIANeMo Guardrails 是一个开源工具库，致力于使 LLM 大语言模型的使用更加合法合规。它可以轻松地为基于 LLM 的对话系统添加可编程护栏，用以避免大语言模型输出违法违规内容

2023-10-21 16:35:03

215

Hugging Face LLM部署大语言模型到亚马逊云科技Amazon SageMaker推理示例

本篇文章主要介绍如何使用新的Hugging Face LLM推理容器将开源LLMs，比如BLOOM大型语言模型部署到亚马逊云科技Amazon SageMaker进行推理的示例。我们将部署12B

2023-11-01 17:48:42

422

LLM的Transformer是否可以直接处理视觉Token？

多种LLM Transformer都可以提升Visual Encoding。例如用LLaMA和OPT的不同Transformer层都会有提升，而且不同层之间也会体现不同的规律。

2023-11-03 14:10:15

181

LLM的幻觉问题最新综述

幻觉被描述为无意义或不忠实于所提供源内容的生成内容。根据与源内容的矛盾，这些幻觉又进一步分为内在幻觉和外在幻觉。在LLMs中，幻觉的范围包含了一个更广泛、更全面的概念，主要集中在事实错误上。本文重新定义了幻觉的分类，为LLM应用程序提供了一个更定制的框架。

2023-11-22 17:40:41

467

基于单一LLM的情感分析方法的局限性

LLM的发展为情感分析任务带来的新的解决方案。有研究人员使用LLM，在上下文学习(in-context learning, ICL)的范式下，仅使用少量的训练示例就能够实现与监督学习策略旗鼓相当的性能表现。

2023-11-23 11:14:27

322

专栏发布 | LLM圈走马换将？微软广告“黑五”来袭！

过去一年并不平凡。从去年11月至今，LLM大型语言模型持续破圈、始终盘踞热点话题之列。根据Adobe Analytics的最新在线购物预测，感恩节本土市场假日季的在线收入，或将有

2023-11-27 08:15:02

215

Long-Context下LLM模型架构全面介绍

随着ChatGPT的快速发展，基于Transformer的大型语言模型(LLM)为人工通用智能(AGI)铺平了一条革命性的道路，并已应用于知识库、人机界面和动态代理等不同领域。然而，存在一个普遍

2023-11-27 17:37:36

440

Ambarella展示了在其CV3-AD芯片上运行LLM的能力

Ambarella前不久展示了在其CV3-AD芯片上运行LLM的能力。这款芯片是CV3系列中最强大的，专为自动驾驶设计。

2023-11-28 09:05:31

1192

怎样使用Accelerate库在多GPU上进行LLM推理呢？

大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长，推理的计算需求也显著增加。

2023-12-01 10:24:52

396

如何利用OpenVINO加速LangChain中LLM任务

LangChain 是一个高层级的开源的框架，从字面意义理解，LangChain 可以被用来构建 “语言处理任务的链条”，它可以让AI开发人员把大型语言模型（LLM）的能力和外部数据结合起来，从而

2023-12-05 09:58:14

325

全面解析大语言模型（LLM）

internal feedback：使用LLM去预测生成的plan取得成功的概率、Tree of Thought去对比不同的plan（有点类似AlphaGo的蒙特卡诺搜索的意思）、对中间结果进行评估并作为长期记忆存储

2023-12-05 14:49:47

857

一文详解LLM模型基本架构

LLM 中非常重要的一个概念是 Token，我们输入给 LLM 和它输出的都是 Token。Token 在这里可以看做语言的基本单位，中文一般是词或字（其实字也是词）。比如：”我们喜欢 Rust

2023-12-25 10:38:38

657

优于10倍参数模型！微软发布Orca 2 LLM

微软发布 Orca 2 LLM，这是 Llama 2 的一个调优版本，性能与包含 10 倍参数的模型相当，甚至更好。

2023-12-26 14:23:16

247

2023年LLM大模型研究进展

作为做LLM应用的副产品，我们提出了RLCD[11]，通过同时使用正例和负例prompt，自动生成带标签的生成样本不需人工标注，然后可以接大模型微调，或者用于训练reward models

2024-01-19 13:55:33

178

LLM推理加速新范式！推测解码（Speculative Decoding）最新综述

这个问题随着LLM规模的增大愈发严重。并且，如下左图所示，目前LLM常用的自回归解码（autoregressive decoding）在每个解码步只能生成一个token。这导致GPU计算资源利用率

2024-01-29 15:54:24

261

100%在树莓派上执行的LLM项目

ChatGPT的人性口语化回复相信许多人已体验过，也因此掀起一波大型语言模型（Large Language Model, LLM）热潮，LLM即ChatGPT背后的主运作技术，但LLM运作需要庞大运算力，因此目前多是在云端（Cloud）上执行。

2024-02-29 16:29:59

476

基于NVIDIA Megatron Core的MOE LLM实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大语言模型（LLM）实现与训练优化上的创新工作。

2024-03-22 09:50:37

已全部加载完成

搜索历史

对比解码在LLM上的应用

评论