Llama 2性能如何

虽然性能仍不及ChatGPT 3.5，但开源的力量是无法估量的。

相信很多人都被 Meta 发布的 Llama 2 刷了屏。OpenAI 研究科学家 Andrej Karpathy 在推特上表示，「对于人工智能和 LLM 来说，这确实是重要的一天。这是目前能够把权重提供给所有人使用的最为强大的 LLM。」

对于开源社区来说，这个大模型就是「全村的希望」。它的出现将进一步缩小开源大模型与闭源大模型的差距，让所有人都有机会基于它构建自己的大模型应用。因此，在过去的 24 个小时，Llama 2 成了所有社区成员关注的焦点。大家都在谈论它的性能、部署方法以及可能带来的影响。为了让大家在第一时间了解这些信息，我们在这篇文章中进行了总结。

Llama 2 性能究竟如何？ 在展示评测结果之前，我们先来梳理一下 Llama 2 的基本信息：

包含 70 亿、130 亿和 700 亿三种参数变体，此外还训练了 340 亿参数变体，但并没有发布，只在技术报告中提到了。

在 2 万亿的 token 上进行训练，相比于 Llama 1，训练数据多了 40%，精调 Chat 模型是在 100 万人类标记数据上训练的。

支持的上下文 token 长度翻倍，由原来的 2048 升级到 4096。

免费可商用，但日活大于 7 亿的产品需要单独申请商用权限。

在 Llama 2 发布后，整个 Llama 项目的 Github star 量正在逼近 30k。

在 Meta 发布的论文中，我们还可以看到 Llama 2 的一些性能情况：

Llama 2 70B 在 MMLU 和 GSM8K 上得分接近 GPT-3.5，但在编码基准上存在显著差距。

在几乎所有基准上，Llama 2 70B 的结果均与谷歌 PaLM (540B) 持平或表现更好，不过与 GPT-4 和 PaLM-2-L 的性能仍存在较大差距。

也就是说，即使是参数量最大的 Llama 2 70B，性能目前也没有超过 GPT-3.5，距离 GPT-4 差距更大。为了测试一下 Llama 2 的实力，各路网友都在想办法对其展开测试，比如让他根据一些「荒唐」的信息写一封公司邮件。

还有人已经开始直播 Llama 2 和其他类 ChatGPT 产品的 PK：

在测试过程中，大家发现了一些问题，比如 Llama 2 受到的 RLHF 训练似乎太多了点，这导致它非常守规矩：

在一位开发者制作的免费应用程序中，机器之心也上手体验了一把。首先，我们问一下 Llama 2 能做什么？Llama 2 回答道：「我可以帮助你处理各种任务，比如回答问题、提供信息，甚至帮助你完成日常任务。我只是一个人工智能，无法在现实中执行任务，但我可以为你提供你需要的信息或帮助……」。从语言上来看，Llama 2 支持中文输入，但回答基本都用英文，中文理解、生成能力有限。

接着问它数据截止到什么时候？从 Llama 2 的回答中，我们可以得知，它掌握的数据截止日期是 2022 年 12 月。

接着，我们向 Llama 2 询问了一个不那么贴切的问题。Llama 2 指出了标题的不合理性，并给出了一些建议：

但是，Llama 2 对鸡兔同笼问题还是不擅长。

在推特上，Vicuna（小羊驼）项目创建者公布了他们的系统测试结果，结论如下：

Llama-2 表现出更强的指令遵循能力，但在信息提取、编码和数学方面仍明显落后于 GPT-3.5/Claude；

对于安全性的过度敏感可能导致对用户查询的错误解读；

在聊天性能上与基于 Llama-1 的领先模型（如 Vicuna、WizardLM）相当；

非英语语言技能有限。

以下是一些测试数据和结果：

哪些设备能在本地跑这些模型？ 由于 Llama 2 开源了不同大小的版本，这些模型在本地部署方面非常灵活。如果你不想把自己的数据传上网，那么本地部署就是最好的选择。这一想法可以通过陈天奇等人打造的 MLC-LLM 项目来实现：

在之前的报道中，我们提到过这个项目。它的目标是让你「在任何设备上都能编译运行大语言模型」，包括移动端、消费级电脑端和 Web 浏览器。它支持的平台包括：

在 Llama 2 发布后，陈天奇等项目成员表示，MLC-LLM 现在支持在本地部署 Llama-2-70B-chat（需要一个带有 50GB VRAM 的 Apple Silicon Mac 来运行）。在 M2 Ultra 上，解码速度可以达到～10.0token / 秒。

当然，借助 MLC-LLM，运行其他版本的 Llama 2 模型更是不在话下：7B 模型在 Apple M2 Max 上的运行速度约为 46 tok/s，在 RTX 4090 上约为 156 tok/s。

此外，借助陈天奇等人发布的「MLC Chat」APP（苹果应用商店可以搜到），我们还可以尝试在手机、iPad 上使用 Llama 2（无需联网）。

Llama 2 将带来哪些影响？ 如果 Meta 没有在今年 2 月份开源 Llama，你可能不知道「羊驼」原来有那么多种写法：基于这一开源模型的「二创」项目几乎占用了生物学羊驼属的所有英文单词。在 Meta 将模型迭代到 2.0 版本后，这些项目自然也被拉到了新的起点。在 Llama 2 发布不到一天的时间里，能够像 GPT-4 一样处理图像信息的大型多模态模型「熔岩羊驼 LLaVA」的开发者就宣布，他们基于 Llama 2 对 LLaVA 进行了更新。新版本增加了对 LLaMA-2 的支持，同时还支持使用学术界 GPU 进行 LoRA 训练，以及更高的分辨率（336x336）和 4-/8- 推理等功能。

此外，他们还发布了新的 LLaVA 变体的预览版本，该版本基于最新的经过 RLHF 微调的 LLaMA-2-Chat 检查点，提供更长的上下文窗口。这些新发布的版本支持并验证了在 RTX 3090 和 RTX A6000 上进行的训练，从而使大型多模态模型的训练更加便捷、更加适用于广大社区用户。

当然，这只是一个开始。假以时日，那些基于 Llama 2 的模型会陆陆续续上线或更新，「千模大战」一触即发。

对于 Llama 的未来发展及影响，英伟达高级 AI 科学家 Jim Fan 也给出了自己的预测：

Llama-2 的训练成本可能超过 2000 万美元。之前，一些大公司的人工智能研究人员因为商业许可问题对 Llama-1 持谨慎态度，但 Llama-2 的商业限制大大松绑，未来很多人可能会加入 Llama 阵营，并贡献他们的实力。

虽然 Llama-2 目前还没有达到 GPT-3.5 的水平，在编程等问题上存在明显短板，但由于它的权重是开放的，这些问题早晚会得到改进；

Llama-2 将极大地推动多模态人工智能和机器人技术的研究。这些领域需要的不仅仅是对 API 的黑盒访问。目前，我们必须将复杂的感官信号（视频、音频、3D 感知）转换为文本描述，然后再输入到 LLM（语言与视觉融合模型）中，这样做非常笨拙，导致信息损失非常严重。直接将感知模块嫁接到强大的 LLM 骨干上将更加高效。

对于研发闭源大模型的企业来说，Llama 2 的发布也是意义重大。如果他们研发的模型本身不够强大，或者和开源 Llama 2 及其衍生模型的差距不大，那么其商业价值将很难变现。编辑：黄飞

阅读全文

人工智能(229987) 人工智能(229987)
ChatGPT(3870) ChatGPT(3870)

RISC-V 跑大模型（二）：LLaMA零基础移植教程

这是RISC-V跑大模型系列的第二篇文章，主要教大家如何将LLaMA移植到RISC-V环境里。

2023-07-17 16:16:20

917

RISC-V 跑大模型（三）：LLaMA中文扩展

这是RISC-V跑大模型系列的第三篇文章，前面我们为大家介绍了如何在RISC-V下运行LLaMA，本篇我们将会介绍如何为LLaMA提供中文支持。

2023-07-17 17:15:47

495

英特尔一系列AI解决方案，为Llama 2大模型提供实力之选

英特尔广泛的AI硬件组合及开放的软件环境，为Meta发布的Llama 2模型提供了极具竞争力的选择，进一步助力大语言模型的普及，推动AI发展惠及各行各业。大语言模型（LLM）在生成文本、总结

2023-07-25 09:56:26

736

基于Llama2和OpenVIN打造聊天机器人

Llama 2是 Meta 发布了其最新的大型语言模型，Llama2 是基于 Transformer 的人工神经网络，以一系列单词作为输入，递归地预测下一个单词来生成文本。

2023-08-06 11:06:30

523

llama.cpp代码结构&调用流程分析

llama.cpp 的代码结构比较直观，如下所示，为整体代码结构中的比较核心的部分的代码结构

2023-11-07 09:23:27

756

大模型笔记之gem5运行模型框架LLama介绍

LLama.cpp 支持x86，arm，gpu的编译。

2024-01-22 09:10:16

317

84BB-0395-A

KEYPAD LEGEND TILE LLAMA

2023-03-29 22:35:13

CC2640和CC2640R2F如何提升IoT应用的性能？

2021-06-15 09:13:20

CC3200布2层板的话，性能方面有什么影响？

请问CC3200是否可以布2层板，性能方面除了影响WIFI的射频性能，还有其他影响吗？

2016-03-23 11:43:19

CCS中性能分析器profile的使用？

专家好， CCS调试程序过程中，需要分析下各函数的执行时间，CCS中提供了性能分析器profile Q1：性能分析器profile是否只能在Simulator下才能使用，Emulator下没有这个功能？ Q2：性能分析器profile的使用方法是否有相应的教程参考？谢谢 NanShan

2018-06-21 19:20:12

ESP32性能怎么样？

2022-02-28 07:20:09

HyperLink有什么性能？

HyperLink介绍HyperLink的性能

2021-04-02 07:37:58

HyperLink的性能

。对影响HyperLink 性能的一些因素进行了讨论。2、HyperLink 配置本节提供了一些配置 HyperLink 模块的补充信息。2.1 Serdes 配置Serdes 必须配置成期望的链接速度。图 1 表示了

2019-06-21 05:00:07

IAP15F2K61S2可仿真单片机性能

接触了当时宏晶(STC)最新推出的 IAP15F2K61S2(对应 STC15F2K60S2)可仿真单片机, 很快就被它的各种新颖性能所吸引:3通道捕获/比较单元（CCP/PWM/PCA）；双

2021-09-17 08:19:50

IEC62722-2-1灯具性能测试？主要有那些测试内容？

关于灯具光学、能效、性能等，我司可办理DLC，LM-80，ERP，IEC 62612，IEC62722-2-1，IEC60969，IEC62717，TM-21，LM-79，IES测试，积分球测试，闪

2020-06-26 12:26:37

JE350G跟2SB649相比那种管子的性能好一点，与2SA1943搭配用用...

JE350G跟2SB649相比那种管子的性能好一点，与2SA1943搭配用用哪一种管子音质更好呢？？？？

2012-12-18 21:18:23

Labview性能和内存信息

如图Labview性能和内存信息能看出来内存泄露吗？如上图，未命名1.vi是否存在内存泄露？补充内容 (2016-2-23 21:03): Labview自带的工具能检查出内存泄露吗？

2016-02-23 14:33:55

PTC Creo的性能问题怎么解决

你好，我们在PTC Creo和Nvidia K2以及K260配置文件中遇到了一些性能问题。有没有人有同样的问题？谢谢亚历克斯以上来自于谷歌翻译以下为原文Hello,we have some

2018-09-17 14:36:08

SRAM的性能和结构

SRAM的性能及结构

2020-12-29 07:52:53

XC7A200T-2FFG1156C集成电路具有哪些性能与优势呢

XC7A200T-2FFG1156C集成电路具有哪些性能与优势呢？

2021-12-27 07:08:35

Xendesktop 7.15，K2性能下降

从XD 7.6升级到XD 7.15后，桌面的性能显着下降。 AutoCAD的鼠标滞后时间长达15秒。我们认为K2不支持XD 7.15的所有新功能。有人做同样的经历吗？最好的祝福，西蒙以上来自于谷歌

2018-09-25 14:56:52

【昉·星光 2 高性能RISC-V单板计算机体验】星光 2 功耗测评

星光 2是迄今最高性能单板机。搭载高性能昉·惊鸿7110搭载64位高性能四核RISC-V CPU，2MB的二级缓存，工作频率最高可达1.5 GHz。昉·惊鸿7110具有多个的高速本地接口，支持

2023-09-28 10:34:57

【算能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

ChatGLM2-6B、AIGC、Llama2、SAM、Whisper等超大参数模型还有一份详细的英文的规格表：另外，算能RADXA微服务器服务器，还是大学生集成电路创新创业大赛之# 第八届集创赛杯赛题目

2024-02-28 11:21:57

【飞凌RZ/G2L开发板试用体验】性能测试之CPU性能

性能测试之CPU性能前言CoreMark是用在嵌入式系统中用来测量CPU性能的基准程序。该标准于2009年由EEMBC（Embedded Microprocessor Benchmark

2022-08-16 14:03:54

【飞凌RZ/G2L开发板试用体验】性能测试之EMMC性能

性能测试之EMMC性能前言对于越来越高端的嵌入式芯片,尤其用于汽车,人机,AI,边缘计算等场景的高性能CPU,其综合性能是一个关注点，板子的性能不仅仅和CPU相关,综合来看的话存储部分也是一个很重

2022-08-16 13:17:27

【飞凌RZ/G2L开发板试用体验】性能测试之RAM性能

性能测试之RAM测试前言对于越来越高端的嵌入式芯片,尤其用于汽车,人机,AI,边缘计算等场景的高性能CPU,其综合性能是一个关注点，板子的性能不仅仅和CPU相关,综合来看的话存储部分也是一个很重

2022-08-16 12:51:08

【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

预训练语言模型。该模型最大的特点就是基于以较小的参数规模取得了优秀的性能，根据官网提供的信息，LLaMA的模型包含4个版本，最小的只有70亿参数，最大的650亿参数，但是其性能相比较之前的OPT

2023-12-22 10:18:11

一个相当低的增益设备

描述Red LLama / CA Tube Sound Fuzz新的 Red Llama 与原版略有不同。它仍然令人印象深刻，但不如其前身那么甜美。话虽如此，它是少数几个在打开时不会给吉他音色上色

2022-08-05 07:11:36

中山哪里可以做IEC62722-2-1灯具性能测试？

关于灯具光学、能效、性能等，我司可办理DLC，LM-80，ERP，IEC 62612，IEC62722-2-1，IEC60969，IEC62717，TM-21，LM-79，IES测试，积分球测试，闪

2020-06-29 16:04:47

什么是OTP-638D2？OTP-638D2有哪些性能参数？

2021-06-16 07:06:09

什么是插头电脑？它的性能如何？

什么是插头电脑？它的性能如何？用途何在？如何使用？

2021-06-04 07:24:22

制备方法对Ba2FeMoO6双钙钛矿磁性能的影响

制备方法对Ba2FeMoO6双钙钛矿磁性能的影响采用湿化学法和固相反应制备了Ba2FeMoO6双钙钛矿化合物，对比研究了制备方法对其磁性能尤其是磁卡效应的影响。实验结果表明，湿化学法准备的样品具有

2009-05-26 00:22:45

如何估算FPGA的峰值性能？

（即2）来获得可用的操作单元。这是1,800。4-每个操作单元需要282个LUT。可用逻辑只能支持982个操作单元，因此性能如下：989运算* 393 MHz = 385,926 MFlops

2020-08-13 09:56:00

如何促使2D和3D视觉检测的性能成倍提升？

本文介绍的三个应用案例展示了业界上先进的机器视觉软件和及其图像预处理技术如何促使2D和3D视觉检测的性能成倍提升。

2021-02-22 06:56:21

如何提升SRAM性能？

提升SRAM性能的传统方法

2021-01-08 07:41:27

如何提升基站性能？

2021-05-26 06:33:50

如何提高FATFS SD性能？

2022-02-11 06:28:46

如何提高VMMK器件的性能？

2021-05-21 06:35:39

如何提高天线的性能？

无论您的系统是用于无线通信、雷达，还是 EMI/EMC 测试，系统的性能水平都是由其中的天线决定的。系统天线的性能决定了系统的整体质量，最终可能会影响整个程序或应用软件的效率。本文介绍了 5 个旨在帮助您提高天线性能的关键要点。

2021-02-24 07:24:14

嵌入设备的实时性能是什么

2021-04-28 06:18:31

怎么使用现代仿真技术验证M2M或MTC应用的性能？

本文将讨论如何在产品开发过程中，使用现代仿真技术验证M2M或MTC应用的性能，以便制造商在现场部署产品时有信心保证无差错地工作。

2021-04-19 08:03:11

怎么测试高速ADC的性能？

目前的实时信号处理机要求ADC尽量靠近视频､中频甚至射频,以获取尽可能多的目标信息｡因而,ADC的性能好坏直接影响整个系统指标的高低和性能好坏,从而使得ADC的性能测试变得十分重要｡那要怎么测试高速ADC的性能？

2021-04-14 06:02:51

浙江LED灯做IEC62722-2-1性能报告哪里可以办理？

关于灯具光学、能效、性能等，我司可办理DLC，LM-80，ERP，IEC 62612，IEC62722-2-1，IEC60969，IEC62717，TM-21，LM-79，IES测试，积分球测试，闪

2020-06-29 16:24:10

苹果iPad 2配置性能价格大暴光

在产品重量上做出的努力。·双核A5处理器显示性能提升9倍苹果iPad 2采用全新的A5处理器(1GHz)，双核架构提升了多任务处理能力，CPU速度比老款iPad提升了两倍，并带来高达9倍的显示性能

2011-03-03 16:55:52

衬底温度对CuCrO_2薄膜光电性能影响

【作者】：李杨超;张铭;赵学平;董国波;严辉;【来源】：《纳米科技》2010年01期【摘要】：采用射频磁控溅射法制备了不同衬底温度的CuCrO2薄膜,通过X射线衍射、扫描电镜、紫外吸收光谱及电学性能

2010-04-24 09:00:59

请问如何测量RT1050的USB性能？

示例吗？2) evkbimxrt1050_dev_hid_mouse_freertos 只有“中断输入”，如何修改示例以具有“批量输出”以进行 USB 性能测试？

2023-04-04 08:57:51

金属材料的工艺性能和切削加工性能

。对金属材料而言、铸造性主要包括流动性、收缩率、偏析倾向等指标。流动性好、收缩率小、偏析倾向小的材料其铸造性也好。对某些工程缩料而言，在其成型工艺方法中，也要求较好的流动性和小的收缩率。（2）锻造性能可锻性

2017-08-25 09:36:21

高性能DSP

有哪些新型可用于基带处理的高性能DSP？性能参数如何？

2018-06-24 05:20:19

高性能Sitara AM2xMCU具有哪些特性

的功能。本文将介绍高性能SitaraAM2x MCU帮助设计工程师克服当前和未来系统挑战的五大特性，如图1所示。图1：Sitara AM2x高性能MCU的优势实现更强大的性能MCU最近在内存大小、模拟

2022-11-04 06:28:40

树莓派4B软路由设置教程，及性能测试

性能测试树莓派

Powersee发布于 2022-01-20 21:05:55

与ChatGPT性能最相匹配的开源模型

最近由UC Berkeley、CMU、Stanford, 和 UC San Diego的研究人员创建的 Vicuna-13B，通过在 ShareGPT 收集的用户共享对话数据中微调 LLaMA获得。

2023-04-06 10:16:06

962

“伶荔”(Linly) 开源大规模中文语言模型

Linly-Chinese-LLaMA：中文基础模型，基于 LLaMA 在高质量中文语料上增量训练强化中文语言能力，现已开放 7B、13B 和 33B 量级，65B 正在训练中。

2023-05-04 10:29:07

706

首个中文医学知识LLM：真正的赛华佗—华驼(HuaTuo)

通过医学知识图谱和 GPT 3.5 API 构建了中文医学指令数据集，并在此基础上对 LLaMA 进行了指令微调，提高了 LLaMA 在医疗领域的问答效果。

2023-05-08 11:30:21

1186

VPG 在 LLM 之间的可迁移性问题

通过我们的VPGTrans框架可以根据需求为各种新的大语言模型灵活添加视觉模块。比如我们在LLaMA-7B和Vicuna-7B基础上制作了VL-LLaMA和VL-Vicuna。

2023-05-17 11:46:25

497

LLM性能的主要因素

目前主要的模型的参数 LLaMA系列是否需要扩中文词表不同任务的模型选择影响LLM性能的主要因素 Scaling Laws for Neural Language Models OpenAI的论文

2023-05-22 15:26:20

1148

基于LLAMA的魔改部署

去训练），并且和Vision结合的大模型也逐渐多了起来。所以怎么部署大模型是一个超级重要的工程问题，很多公司也在紧锣密鼓的搞着。目前效果最好讨论最多的开源实现就是LLAMA，所以我这里讨论的也是基于 LLAMA的魔改部署。基于LLAMA的finetune模型

2023-05-23 15:08:47

4397

State of GPT：大神Andrej揭秘OpenAI大模型原理和训练过程

你可以看到，Llama 的参数数量大概是 650 亿。现在，尽管与 GPT3 的 1750 亿个参数相比，Llama 只有 65 个 B 参数，但 Llama 是一个明显更强大的模型，直观地说，这是

2023-05-30 14:34:56

642

击败LLaMA？史上最强「猎鹰」排行存疑，符尧7行代码亲测，LeCun转赞

「我们在MMLU上复现了LLaMA 65B的评估，得到了61.4的分数，接近官方分数（63.4），远高于其在Open LLM Leaderboard上的分数（48.8），而且明显高于猎鹰（52.7）。」

2023-06-09 16:43:14

820

号称「碾压」LLaMA的Falcon实测得分仅49.08，HuggingFace决定重写排行榜代码

这是一组由 Meta 开源的大型语言模型，共有 7B、13B、33B、65B 四种版本。其中，LLaMA-13B 在大多数数据集上超过了 GPT-3（175B），LLaMA-65B 达到了和 Chinchilla-70B、PaLM-540B 相当的水平。

2023-06-11 11:24:20

421

智能开源大模型baichuan-7B技术改进

baichuan-7B 主要是参考LLaMA进行的改进，且模型架构与LLaMA一致。而在开源大模型中，LLaMA无疑是其中最闪亮的星，但LLaMA存在如下问题： LLaMA 原生仅支持 Latin

2023-06-17 14:14:28

706

LLaMA生态中的各个模型梳理

既然已经有了成功ChatGPT这一成功的案例，大家都想基于LLaMA把这条路再走一遍，以期望做出自己的ChatGPT。

2023-07-04 15:07:25

3281

RISC-V跑大模型（二）：LLaMA零基础移植教程

这是RISC-V跑大模型系列的第二篇文章，主要教大家如何将LLaMA移植到RISC-V环境里。

2023-07-10 10:10:38

706

RoPE可能是LLM时代的Resnet

通过线性插值RoPE扩张LLAMA context长度最早其实是在llamacpp项目中被人发现，有人在推理的时候直接通过线性插值将LLAMA由2k拓展到4k，性能没有下降，引起了很多人关注。

2023-07-14 16:58:17

347

高通携手Meta利用Llama 2赋能终端侧AI应用

要点 — • 高通计划从2024 年起，在旗舰智能手机和PC上支持基于Llama 2的AI部署，赋能开发者使用骁龙平台的AI能力，推出激动人心的全新生成式AI应用。 • 与仅仅使用云端AI部署

2023-07-19 10:00:02

323

高通携手Meta利用Llama 2赋能终端侧AI应用

高通计划从2024年起，在旗舰智能手机和PC上支持基于Llama 2的AI部署，赋能开发者使用骁龙平台的AI能力，推出激动人心的全新生成式AI应用。

2023-07-19 10:00:03

462

高通携手Meta利用Llama 2赋能终端侧AI应用

因此，高通技术公司计划支持基于llama 2的终端ai部署，以创建新的、有趣的ai应用程序。通过这种方式，客户、合作伙伴和开发者可以构建智能模拟器、生产力应用程序、内容制作工具和娱乐等的使用案例。骁龙®赋能实现的新终端ai体验，即使在飞行模式下，也可以在没有网络连接的地区运行。

2023-07-19 10:26:38

345

AI竞赛追赶者联盟？“云-边”一体或成为AI应用闭环的必由之路

当地时间7月18日，Meta宣布，将发布其开源大模型LLaMA商用版本，新版本名为Llama 2。

2023-07-20 10:27:59

193

Meta推出免费大模型Llama 2，GPT要有危机感了

作为Meta首批合作伙伴之一，亚马逊云科技宣布客户可以通过Amazon SageMaker JumpStart来使用Meta开发的Llama 2基础模型。

2023-07-21 16:10:59

904

Llama2的技术细节探讨分析

模型结构为Transformer结构，与Llama相同的是采用RMSNorm归一化、SwiGLU激活函数、RoPE位置嵌入、词表的构建与大小，与Llama不同的是增加GQA（分组查询注意力），扩增了模型输入最大长度，语料库增加了40%。

2023-07-23 12:36:54

1098

英特尔一系列AI解决方案，为Llama 2大模型提供实力之选

英特尔广泛的AI硬件组合及开放的软件环境，为Meta发布的Llama 2模型提供了极具竞争力的选择，进一步助力大语言模型的普及，推动AI发展惠及各行各业。大语言模型（LLM）在生成文本、总结和翻译

2023-07-24 19:31:56

387

Llama 2 登陆 Azure 和 Windows，微软与 Meta 拓展人工智能合作伙伴关系

和 Windows 上支持 Llama 2 大型语言模型（LLM）系列。Llama 2 旨在帮助开发者和组织构建生成式人工智能工具和体验。Meta 和微软共同致力于实现“让人工智能惠及更多

2023-07-26 10:35:01

303

Meta推出Llama 2 免费开放商业和研究机构使用

与所有LLM一样，Llama 2偶尔会产生不正确或不可用的答案，但Meta介绍Llama的论文声称，它在学术基准方面与OpenAI的GPT 3.5不相上下，如MMLU（衡量LLM在57门STEM科目中的知识）和GSM8K（衡量LLM对数学的理解）。

2023-08-02 16:17:25

410

爆火Llama 2一周请求下载超15万，有人开源了Rust实现版本

随着 Llama 2 的逐渐走红，大家对它的二次开发开始流行起来。前几天，OpenAI 科学家 Karpathy 利用周末时间开发了一个明星项目 llama2.c，借助 GPT-4，该项目仅用

2023-08-02 16:25:28

470

IBM 计划在 watsonx 平台上提供 Meta 的 Llama 2 模型

IBM 企业就绪的 AI 和数据平台 watsonx 不断推出新功能。IBM 宣布，计划在 watsonx 的 AI 开发平台 watsonx.ai 上纳入 Meta 的 700 亿参数 Llama

2023-08-09 20:35:01

314

Meta即将推出开源代码生成平台Code Llama，剑指OpenAI Codex

Code Llama 的卓越功能源自行业领先的 AI 算法。其核心模型由包含编程语言、编码模式和最佳实践的大规模数据集训练而成。自然语言处理（NLP）技术则让 Code Llama 有能力理解开发者的输入，并生成与上下文相匹配的代码建议。

2023-08-21 15:15:02

570

深入理解Llama模型的源码案例

目前大部分开源LLM模型都是基于transformers库来做的，它们的结构大部分都和Llama大同小异。

2023-08-23 11:44:07

1462

关于Llama 2的一切资源，我们都帮你整理好了

Meta 发布的 Llama 2，是新的 SOTA 开源大型语言模型（LLM）。Llama 2 代表着 LLaMA 的下一代版本，可商用。Llama 2 有 3 种不同的大小 —— 7B、13B 和 70B 个可训练参数。

2023-08-23 15:40:09

674

MediaTek运用Meta Llama 2大语言模型，赋能终端设备生成式AI应用

2023 年 8 月 24 日 – MediaTek今日宣布利用Meta新一代开源大语言模型（LLM）Llama 2 以及MediaTek先进的AI处理器（APU）和完整的AI开发平台

2023-08-24 13:41:03

225

Meta发布一款可以使用文本提示生成代码的大型语言模型Code Llama

今天，Meta发布了Code Llama，一款可以使用文本提示生成代码的大型语言模型（LLM）。

2023-08-25 09:06:57

885

Meta将推出编程人工智能工具：Code Llama，免费提供

据路透社报道，meta计划推出全新编程人工智能模型：Code Llama，可以根据文字提示来编写计算机代码，或协助开发者编程。这一AI工具将免费提供。

2023-08-25 11:39:00

493

Meta发布一种Code Llama工具用于生成新代码和调试人工编写工作

Meta公司表示，Meta发布了一种名为Code Llama的工具，该工具建立在其Llama 2大型语言模型的基础上，用于生成新代码和调试人工编写的工作。 Code Llama将使用与Llama

2023-08-28 16:56:39

932

端侧大模型到通用智能体——智能手机AI进化的下一场革命(一)

时隔半年后，Meta AI在周二发布了最新一代开源大模型Llama 2。相较于今年2月发布的Llama 1，训练所用的token翻了一倍至2万亿，同时对于使用大模型最重要的上下文长度限制，Llama 2也翻了一倍。Llama 2包含了70亿、130亿和700亿参数的模型。

2023-08-29 16:50:10

950

8G显存一键训练，解锁Llama2隐藏能力！XTuner带你玩转大模型

针对 GPU 计算特点，在显存允许的情况下，XTuner 支持将多条短数据拼接至模型最大输入长度，以此最大化 GPU 计算核心的利用率，可以显著提升训练速度。例如，在使用 oasst1 数据集微调 Llama2-7B 时，数据拼接后的训练时长仅为普通训练的 50% 。

2023-09-04 16:12:26

1242

【AI简报20230908期】正式亮相！打开腾讯混元大模型，全部都是生产力

1. 1800亿参数，世界顶级开源大模型Falcon官宣！碾压LLaMA 2，性能直逼GPT-4 原文： https://mp.weixin.qq.com

2023-09-08 19:15:02

480

LLaMA微调显存需求减半，清华提出4比特优化器

从 GPT-3，Gopher 到 LLaMA，大模型有更好的性能已成为业界的共识。但相比之下，单个 GPU 的显存大小却增长缓慢，这让显存成为了大模型训练的主要瓶颈，如何在有限的 GPU 内存下训练大模型成为了一个重要的难题。

2023-09-11 16:08:49

240

开源大模型Falcon（猎鹰） 180B发布 1800亿参数

世界最强开源大模型 Falcon 180B 忽然火爆全网，1800亿参数，Falcon 在 3.5 万亿 token 完成训练，性能碾压 Llama 2，登顶 Hugging Face 排行榜

2023-09-18 09:29:05

876

浪潮信息NF5468服务器LLaMA训练性能

的浪潮信息NF5468服务器大幅提升了LLaMA大模型的微调训练性能。目前该产品已具备交付能力，客户可以进行下单采购。

2023-09-22 11:16:31

1813

怎样使用QLoRA对Llama 2进行微调呢？

使用QLoRA对Llama 2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题

2023-09-22 14:27:21

939

在线研讨会 | 基于 LLM 构建中文场景检索式对话机器人：Llama2 + NeMo

4,096，并对算法细节进行了优化，加速了推理速度，让 Llama2 的性能有了很大的提升，能够和 ChatGPT 相媲美。 Llama2 大模型旨在处理广泛的语言任务，包括文本生成、机器翻译、问题回答、代码生成等等。该模型经过大规模的训练，能够理解并生成文本，为各种应用提供强大的自然语言处理能力。它的多

2023-10-13 20:35:02

564