电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

电子发烧友网>人工智能>对比解码在LLM上的应用

对比解码在LLM上的应用

收藏

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论

查看更多

相关推荐

【比特熊充电栈】实战演练构建LLM对话引擎

大模型时代,安全问题不容小觑。但如果把大模型比作孙悟空,那 NVIDIA NeMo Guardrails 就是“安全护栏”,可以轻松的为基于 LLM 的对话系统添加可编程护栏,来避免大语言模型输出
2023-09-19 13:40:04717

突破边界:高性能计算引领LLM驶向通用人工智能AGI的创新纪元

ChatGPT的成功带动整个AIGC产业的发展,尤其是LLM(大型语言模型,大语言模型)、NLP、高性能计算和深度学习等领域。LLM的发展将为全球和中国AI芯片、AI服务器市场的增长提供强劲动力,据估算,LLM将为全球和中国AI服务器带来约891.2亿美元和338.2亿美元的市场空间。
2023-06-25 14:31:15575

TensorRT-LLM初探(一)运行llama

TensorRT-LLM正式出来有半个月了,一直没有时间玩,周末趁着有时间跑一下。
2023-11-16 17:39:34772

基于ICL范式的LLM的最高置信度预测方案

本文假设不同的ICL为LLM提供了关于任务的不同知识,导致对相同数据的不同理解和预测。因此,一个直接的研究问题出现了:llm能否用多个ICL提示输入来增强,以提供最可信的预测?为解决这个问题,本文提出上下文采样(ICS)。ICS遵循三步流程:采样、增强和验证,如图1所示。
2023-11-24 11:20:46863

低比特量化技术如何帮助LLM提升性能

针对大语言模型 (LLM) 在部署过程中的性能需求,低比特量化技术一直是优化效果最佳的方案之一,本文将探讨低比特量化技术如何帮助 LLM 提升性能,以及新版 OpenVINO 对于低比特量化技术的支持。
2023-12-08 15:26:45554

使用基于Transformers的API在CPU上实现LLM高效推理

英特尔 Extension for Transformers是英特尔推出的一个创新工具包,可基于英特尔 架构平台,尤其是第四代英特尔 至强 可扩展处理器(代号 SapphireRapids,SPR)显著加速基于Transformers的大语言模型( LargeLanguageModel,LLM)。
2024-01-22 11:11:061823

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc
2022-11-04 17:22:44

AT32微控制器实现基于Zbar解码库的QR Decode应用程序

本应用笔记的目的是提供在AT32微控制器实现基于Zbar解码库的QR Decode应用程序的一般方法。
2023-10-26 08:07:21

FPGAh.264视频编解码的实现

想在DE2-115的开发板完成h.264视频编解码,自己的想法是已有的tpad_camer代码加一软核,但一直失败,希望有相关经验的高手指点下?
2014-03-05 16:24:19

RK3288主板Debian 9.13系统如何调用CPU硬解进行网络摄像头视频流解码

RK3288主板Debian 9.13系统如何调用CPU硬解进行网络摄像头视频流解码
2022-03-03 06:47:08

TMS320C6657器件轻松运行经TI 优化的Opus编码器/解码

适用于语音通信、联网音频甚至高性能音频处理应用。较之 ARM 等通用处理器,此设计还通过 DSP 实现 Opus 编解码器来提升性能。根据通用处理器所运行代码的优化级别,通过 C66x TI
2022-09-22 06:32:42

AMBA解码器产品手册

以作为一个简单的保护单元,防止试图访问存储器映射的非法或受保护区域。 提供了该解码器的两种实现: ·带译码周期的译码。 这是默认型号。 此实现会自动插入一个解码周期: -非顺序传输开始时-断言BLAST时顺序传输-当达到1KB内存边界时
2023-08-22 06:26:05

AVS与其他主要主要编解码技术对比

AVS与其他主要主要编解码技术对比编码工具AVSH.264MPEG2帧内预测基于8*8块,5种亮度预测模式,4种色度预测模块基于4*4块,9种亮度预测模式,4种色度预测模式只有频域内进行DC系数差分
2011-02-13 20:34:47

Blast Extreme会卸载端点GPU解码吗?

大家好,我对Horizo​​n 7的好处感到非常兴奋 -Blast Extreme能够将编码卸载到GPU。这是否也允许将解码卸载到端点的GPU?或者解码仍然发生在CPU中?谢谢!理查德以上
2018-09-30 10:45:06

CH32V103的AB相编码器正交解码,数据少一半是为什么?

如题,我将CH32V103的正交解码功能引脚与光栅尺的AB相输出相连(例如TIM3的PC6 PC7引脚)并编程开启正交解码功能,通过串口发送至PC查看数据。AB相正交解码应该是AB两相的四个信号
2022-06-09 07:37:19

DM8168DVRRDK的应用咨询

第3、4点的基础,如果输入是两路H.264码流,能否实现这两路信号的任意混叠后再输出。 6、使用两个DM8168分别解码一个DM8168编码后的码流,这两个解码DM8168输出的图像能否做到同步
2018-05-31 08:59:04

FPGA对比STM32解码方面有什么优势?

为什么FPGA解码方面用的更多
2023-10-30 08:52:22

GM7150 视频解码芯片 国腾电子

源选择、A/D 转换、自动钳位、自动增益控制(AGC)、时钟发生(CGC)、多制式解码、亮度/对比度/饱和度控制(BCS)。噪点处理上比TVP5150效果更好,军工工艺,性价比更高。
2013-12-16 13:30:47

H264解码器h264hpvdec修改为实时解码,请问应该从何处修改?

insufficient to decode a picture)的错误,即解码第二个P帧时没有将SPS包、PPS包和I帧的数据用起,TI的解码器库是否具有解码新的一帧时利用解码一帧用到的H264码流的特性?
2018-08-03 08:43:02

MP3解码芯片

中人们仍然习惯性地称它们为“解码芯片”。2 MP3解码芯片作用   MP3解码芯片的作用顾名思义就是将存储介质的MP3文件解码。它是MP3工作中最重要的一环,很大程度上影响最终的音质表现。MP3
2016-12-14 14:16:35

MP3解码芯片的原理是什么?

MP3解码芯片的作用顾名思义就是将存储介质的MP3文件解码。它是MP3工作中最重要的一环,很大程度上影响最终的音质表现。MP3是一种有损压缩的格式,如果MP3播放器拥有优秀的解码芯片就能够更好
2019-10-25 09:13:36

MTK解码芯片对比

MTK解码芯片对比表General Features For Amoi OnlyChip Version 79 89B 89C 89D 89E 89HDVideo compression MPEG
2008-08-05 12:46:31

PAL制解码电路及系统

, 到达解码矩阵的时间就不相同而使重现的图像出现彩色镶边现象。为此, 应在亮度通道中设置延时电路。   第四, 视频全电视信号若失去直流分量, 黑白电视机中仅改变
2010-10-01 17:10:34

STM32的音频编码与PC端的解码简介

STM32的音频编码与PC端的解码简介STM32F4移植编码PC移植解码结尾简介能看到这篇文章的基本都是有迫切需求的人,话不多说,切入正题编解码库:Speex编码硬件平台:STM32F411
2021-08-12 07:45:40

TDA8376解码集成电路资料推荐

TDA8376是飞利蒲公司生产的解码集成电路,内部包括:P/N制式色度解码、亮度处理、同步处理、RGB控制、偏转控制。TCL 3498GH机型测定序号符号功能。
2021-05-07 06:52:38

mp3软件音频解码实现语音播报功能

最近做了一个无人机的语音播放项目,查了一下网上大部分都是硬件解码,成本相对比较高,而为了节约成本,我们采用了stm32f446 RET6作为主控+tas5720作为dac功放,实现mp3软件音频解码
2021-08-12 07:56:45

【原创】对bmp格式2位黑白图片解码并显示12864液晶

` 本帖最后由 gtbestom 于 2014-4-15 10:58 编辑 最近移植成功了fat32文件系统,还认真学习了bmp文件格式,对bmp文件进行了解码,黑白12864液晶屏只能到这样的显示效果了,只对黑白两色位图进行解码,还算成功~^_^新手请大家多多包涵。`
2014-04-07 16:49:03

关于嵌入式DSP的视频编解码的知识点总结的太棒了

关于嵌入式DSP的视频编解码的知识点总结的太棒了
2021-06-08 06:49:22

可配置兼容多标准的视频解码器片系统

可配置兼容多标准的视频解码器片系统世界视频设备市场已经进入从模拟设备向数字设备的转型期,这个为期十年的历史性转折将引发巨大的市场需求。与模拟技术相比,视频的数字化技术可以提高图像的清晰度和质量,并
2009-10-06 09:58:54

如何基于ffmpegubuntu系统添加硬解支持

firefly-rk3288 linuxH264、H265解码一直都是软解,下面将介绍如何基于ffmpeg,ubuntu系统添加硬解支持,首先安装硬解驱动库。这里使用的是国外友人mac_l1
2022-06-14 09:30:16

应用AM3358,请问怎样硬件设计外部连接解码器芯片,实现对图像数据的解码

本帖最后由 一只耳朵怪 于 2018-6-5 14:46 编辑 图像数据由网口发送给AM3358,需要解码,现在想通过外部连接解码器芯片来实现,可是看了下手册,不太清楚ARM由哪些端口可以连接解码器芯片,请高手指教一下,谢谢
2018-06-04 15:35:57

开博尔q30plus音频解码再进一步

纪念版q10plus基础做了众多升级。从用户反馈意见和综合口碑来看,开博尔q10plus已经是极其成熟的旗舰播放器,无论UHD画质还是无损音乐解码都达到了行业顶尖水平。而开博尔官方似乎并不满足现状,本月郑重
2018-08-29 20:45:23

怎么硬件实现红外信号解码

能在硬件实现红外信号解码器吗?或者我应该只产生一个中断信号的下降沿,然后解码所有的软件吗?我已经不同的项目做了好几次,而使用传统的微处理器和软件做这一切。我主要只是计数增量(信号保持高或低的时间
2019-02-14 14:35:23

振南真正实现ADPCM音频解码与播放【为了边解码边播放的流畅度,振南提出了“追随策略”!】

到PC,存为WAV文件,通过播放器软件来播放。总之,不论是使用VS1003去回放它,还是用PC的播放器软件来播放WAV文件,都是使用外部的解码器(硬件或者软件)对ADPCM进行解码的。但是实际
2016-06-17 14:40:28

电路双口网络的参数矩阵实测值和理论值怎样进行对比对比的重点在哪里?

实际测量得到的双口网络的T参数,和理论的T参数矩阵,该怎样进行对比。两者均为2*2矩阵。求解。
2016-12-22 18:11:46

示波器全内存解码的奥秘

我们知道,协议解码是协议分析中一个很重要的功能,它的实用程度取决于解码的准确性、解码范围和解码速度,其中解码范围和解码速度是一对矛盾,二者很难兼得。以往的解码方案中,我们将解码范围限制一定宽度
2016-11-27 22:31:23

红外解码电脑显示

请大家看看为什么电脑不能显示呢?想法是这样的:按下红外遥控器的按钮后,其码值显示到电脑#include#define uchar unsigned char#define uint
2013-10-28 19:07:03

红外遥控解码

红外要控解码 1602显示红外遥控编码
2012-08-13 18:00:11

红外遥控解码程序问题

话很不理解:IRCOM[j]=IRCOM[j] >> 1; //高位补0按照程序的思路,解码后的值就存储 IRCOM[2] 里面,然后跟键码表RecvData[] 进行对比:for(j=0
2017-06-10 16:42:53

请问TC9012红外解码的值如何确定?

好多TC9012红外解码的程序中,有看到0x0C 对应遥控器的 0;0X18对应遥控器的 1,我想知道 这个0x0C 0X18 等解码后的值是怎么确定的呢?、
2019-06-05 04:35:39

请问TI有提供可以6437直接调用的MPEG2,MPEG4或者H.264视频编解码库吗?

本帖最后由 一只耳朵怪 于 2018-6-25 14:21 编辑 各位专家:我想知道TI是否有提供可以6437直接调用的MPEG2,MPEG4或者H.264视频编解码库,如果有的话,如何获取,没有的话,是否有第三方提供?
2018-06-25 07:28:30

请问dm365可以实现接收网络的数据流在本地解码吗?

本帖最后由 一只耳朵怪 于 2018-5-25 15:21 编辑 dm365可以实现接收网络的数据流在dm365上解码吗,貌似demo的decode程序只能解码TI编码的h264或mpeg4
2018-05-25 00:46:28

请问如何控制解码解码的速度呢

请问如何控制解码解码的速度,我发现在解码过程中添加延时会导致解码器错误线程A 往mpp解码器送数据 调用函数decode_put_packet(ffmpeg 拉流)线程B 解码数据 调用函数
2022-09-15 16:05:48

超级电容与电池对比具有哪些明显的特性?

超级电容与电池对比具有哪些明显的特性?超级电容智能电表的应用是什么?
2021-10-13 08:05:23

LH3565彩色解码电路的应用电路图

LH3565是一块单片PAL彩色解码集成电路,它能产生R,G,B三种信号直接输出,并能控制亮度,对比度和色饱和度.应用实例
2010-10-10 10:16:412763

音频解码

音频解码
橙群微电子发布于 2023-03-16 10:00:34

IPTV视频编解码标准的对比与选择

关键词:IPTV , 编解码 , 视频 1、引言 IPTV业务是指基于宽带互联网与宽带接入,以机顶盒或其它具有视频编解码能力的数字化设备作为终端,通过聚合SP的各种流媒体服务内容和增值应用,为用户
2019-01-03 17:04:01910

如何利用LLM做多模态任务?

大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此,现阶段,如何利用LLM做一些多模态任务还是有一定的研究价值的。
2023-05-11 17:09:16648

如何利用LLM做一些多模态任务

本文整理了近两年来基于LLM做vision-lanuage任务的一些工作,并将其划分为4个类别:
2023-05-17 15:02:35575

邱锡鹏团队提出具有内生跨模态能力的SpeechGPT,为多模态LLM指明方向

大型语言模型(LLM)在各种自然语言处理任务上表现出惊人的能力。与此同时,多模态大型语言模型,如 GPT-4、PALM-E 和 LLaVA,已经探索了 LLM 理解多模态信息的能力。然而,当前
2023-05-22 14:38:06417

LLM性能的主要因素

现在是2023年5月,截止目前,网络上已经开源了众多的LLM,如何用较低的成本,判断LLM的基础性能,选到适合自己任务的LLM,成为一个关键。 本文会涉及以下几个问题: 影响LLM性能的主要因素
2023-05-22 15:26:201148

如何利用LLM做多模态任务?

大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口
2023-05-22 15:57:33466

如何最好地使用所有可用的 LLM 工具

鉴于价格和质量的广泛差异,从业者可能很难决定如何最好地使用所有可用的 LLM 工具。此外,如果服务中断,则依赖单个 API 提供者是不可靠的,这可能发生在意外高需求的情况下。
2023-05-23 17:22:30525

LLM在各种情感分析任务中的表现如何

  最近几年,GPT-3、PaLM和GPT-4等LLM刷爆了各种NLP任务,特别是在zero-shot和few-shot方面表现出它们强大的性能。因此,情感分析(SA)领域也必然少不了LLM的影子
2023-05-29 17:24:411379

大型语言模型(LLM)的自定义训练:包含代码示例的详细指南

近年来,像 GPT-4 这样的大型语言模型 (LLM) 因其在自然语言理解和生成方面的惊人能力而受到广泛关注。但是,要根据特定任务或领域定制LLM,定制培训是必要的。本文提供了有关自定义训练 LLM 的详细分步指南,其中包含代码示例和示例。
2023-06-12 09:35:431782

Macaw-LLM:具有图像、音频、视频和文本集成的多模态语言建模

尽管指令调整的大型语言模型 (LLM) 在各种 NLP 任务中表现出卓越的能力,但它们在文本以外的其他数据模式上的有效性尚未得到充分研究。在这项工作中,我们提出了 Macaw-LLM,一种新颖的多模式 LLM,它无缝集成了视觉、音频和文本信息。
2023-06-19 10:35:33876

基于Transformer的大型语言模型(LLM)的内部机制

本文旨在更好地理解基于 Transformer 的大型语言模型(LLM)的内部机制,以提高它们的可靠性和可解释性。 随着大型语言模型(LLM)在使用和部署方面的不断增加,打开黑箱并了解它们的内部
2023-06-25 15:08:49991

基于一个完整的 LLM 训练流程

    在这篇文章中,我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练(Pretrain)、Tokenizer 训练、指令微调(Instruction Tuning)等环节。 文末
2023-06-29 10:08:591202

最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补

LLM 是黑箱模型,缺乏可解释性,因此备受批评。LLM 通过参数隐含地表示知识。因此,我们难以解释和验证 LLM 获得的知识。此外,LLM 是通过概率模型执行推理,而这是一个非决断性的过程。对于 LLM 用以得出预测结果和决策的具体模式和功能,人类难以直接获得详情和解释。
2023-07-10 11:35:001354

适用于各种NLP任务的开源LLM的finetune教程~

ChatGLM2-6b是清华开源的小尺寸LLM,只需要一块普通的显卡(32G较稳妥)即可推理和微调,是目前社区非常活跃的一个开源LLM
2023-07-24 09:04:221311

LLM对程序员的冲击和影响

LLM 对软件研发的单点提效,我之前录制过一段视频,大家可以直接观看,里面有详细的演示,我在这里就不再赘述了。
2023-07-24 15:39:06766

LLM的长度外推浅谈

苏神最早提出的扩展LLM的context方法,基于bayes启发得到的公式
2023-07-28 17:37:431484

MLC-LLM的编译部署流程

MLC-LLM部署在各种硬件平台的需求,然后我就开始了解MLC-LLM的编译部署流程和RWKV World模型相比于MLC-LLM已经支持的Raven系列模型的特殊之处。 MLC-LLM的编译部署流程
2023-09-04 09:22:461569

检索增强LLM的方案全面的介绍

分分享了 ChatGPT 这类模型是如何一步一步训练的,后半部分主要分享了 LLM 模型的一些应用方向,其中就对检索增强 LLM 这个应用方向做了简单介绍。
2023-09-08 16:39:55799

mlc-llm对大模型推理的流程及优化方案

在 MLC-LLM 部署RWKV World系列模型实战(3B模型Mac M2解码可达26tokens/s) 中提到要使用mlc-llm部署模型首先需要一个编译过程,将原始的基于Realx搭建的模型
2023-09-26 12:25:55383

Continuous Batching:解锁LLM潜力!让LLM推断速度飙升23倍,降低延迟!

本文介绍一篇 LLM 推理加速技术 相关的文章,值得读一读。 LLMs 在现实应用中的计算成本主要由服务成本所主导,但是传统的批处理策略存在低效性。在这篇文章中,我们将告诉
2023-10-15 20:25:02292

在线研讨会 | 基于 Jetson 边缘计算平台构建 Azure OpenAI LLM 安全护栏

NVIDIANeMo Guardrails 是一个开源工具库,致力于使 LLM 大语言模型的使用更加合法合规。它可以轻松地为基于 LLM 的对话系统添加可编程护栏,用以避免大语言模型输出违法违规内容
2023-10-21 16:35:03215

Hugging Face LLM部署大语言模型到亚马逊云科技Amazon SageMaker推理示例

 本篇文章主要介绍如何使用新的Hugging Face LLM推理容器将开源LLMs,比如BLOOM大型语言模型部署到亚马逊云科技Amazon SageMaker进行推理的示例。我们将部署12B
2023-11-01 17:48:42422

LLM的Transformer是否可以直接处理视觉Token?

多种LLM Transformer都可以提升Visual Encoding。例如用LLaMA和OPT的不同Transformer层都会有提升,而且不同层之间也会体现不同的规律。
2023-11-03 14:10:15181

LLM的幻觉问题最新综述

幻觉被描述为无意义或不忠实于所提供源内容的生成内容。根据与源内容的矛盾,这些幻觉又进一步分为内在幻觉和外在幻觉。在LLMs中,幻觉的范围包含了一个更广泛、更全面的概念,主要集中在事实错误上。本文重新定义了幻觉的分类,为LLM应用程序提供了一个更定制的框架。
2023-11-22 17:40:41467

基于单一LLM的情感分析方法的局限性

LLM的发展为情感分析任务带来的新的解决方案。有研究人员使用LLM,在上下文学习(in-context learning, ICL)的范式下,仅使用少量的训练示例就能够实现与监督学习策略旗鼓相当的性能表现。
2023-11-23 11:14:27322

专栏发布 | LLM圈走马换将?微软广告“黑五”来袭 !

过 去一年并不平凡 。 从去年11月至今,LLM大型语言模型持续破圈、始终盘踞热点话题之列。 根据Adobe Analytics的最新在线购物预测,感恩节本土市场假日季的在线收入,或将有
2023-11-27 08:15:02215

Long-Context下LLM模型架构全面介绍

随着ChatGPT的快速发展,基于Transformer的大型语言模型(LLM)为人工通用智能(AGI)铺平了一条革命性的道路,并已应用于知识库、人机界面和动态代理等不同领域。然而,存在一个普遍
2023-11-27 17:37:36440

Ambarella展示了在其CV3-AD芯片上运行LLM的能力

Ambarella前不久展示了在其CV3-AD芯片上运行LLM的能力。这款芯片是CV3系列中最强大的,专为自动驾驶设计。
2023-11-28 09:05:311192

怎样使用Accelerate库在多GPU上进行LLM推理呢?

大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。
2023-12-01 10:24:52396

如何利用OpenVINO加速LangChain中LLM任务

LangChain 是一个高层级的开源的框架,从字面意义理解,LangChain 可以被用来构建 “语言处理任务的链条”,它可以让AI开发人员把大型语言模型(LLM)的能力和外部数据结合起来,从而
2023-12-05 09:58:14325

全面解析大语言模型(LLM

internal feedback:使用LLM去预测生成的plan取得成功的概率、Tree of Thought去对比不同的plan(有点类似AlphaGo的蒙特卡诺搜索的意思)、对中间结果进行评估并作为长期记忆存储
2023-12-05 14:49:47857

一文详解LLM模型基本架构

LLM 中非常重要的一个概念是 Token,我们输入给 LLM 和它输出的都是 Token。Token 在这里可以看做语言的基本单位,中文一般是词或字(其实字也是词)。比如:”我们喜欢 Rust
2023-12-25 10:38:38657

优于10倍参数模型!微软发布Orca 2 LLM

微软发布 Orca 2 LLM,这是 Llama 2 的一个调优版本,性能与包含 10 倍参数的模型相当,甚至更好。
2023-12-26 14:23:16247

2023年LLM大模型研究进展

作为做LLM应用的副产品,我们提出了RLCD[11],通过同时使用正例和负例prompt,自动生成带标签的生成样本不需人工标注,然后可以接大模型微调,或者用于训练reward models
2024-01-19 13:55:33178

LLM推理加速新范式!推测解码(Speculative Decoding)最新综述

这个问题随着LLM规模的增大愈发严重。并且,如下左图所示,目前LLM常用的自回归解码(autoregressive decoding)在每个解码步只能生成一个token。这导致GPU计算资源利用率
2024-01-29 15:54:24261

100%在树莓派上执行的LLM项目

ChatGPT的人性口语化回复相信许多人已体验过,也因此掀起一波大型语言模型(Large Language Model, LLM)热潮,LLM即ChatGPT背后的主运作技术,但LLM运作需要庞大运算力,因此目前多是在云端(Cloud)上执行。
2024-02-29 16:29:59476

基于NVIDIA Megatron Core的MOE LLM实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大语言模型(LLM)实现与训练优化上的创新工作。
2024-03-22 09:50:3758

已全部加载完成