爱芯通元NPU完成Llama 3和Phi-3大模型适配，推动AI大模型技术普及-电子发烧友网

背景

AI大模型技术的持续进步正在推动千行百业智能化升级。近日，Meta、Microsoft相继发布具有里程碑意义的Llama 3系列和Phi-3系列模型，其中Llama 3包括8B、70B两种规格，Phi-3包括mini（3.8B）、small（7B）、medium（14B）三种规格。为了进一步给开发者提供更多尝鲜，爱芯元智的NPU工具链团队迅速响应，已基于AX650N平台完成 Llama 3 8B和Phi-3-mini模型适配。

Llama 3

上周五，Meta发布了Meta Llama 3系列语言模型（LLM），具体包括一个8B模型和一个70B模型在测试基准中，Llama 3模型的表现相当出色，在实用性和安全性评估中，与那些市面上流行的闭源模型不相上下。

在架构层面，Llama 3选择了标准的仅解码（decoder-only）式Transformer架构，采用包含128K token词汇表的分词器。Llama 3使用了超过15T的公开数据进行训练，其中5%为非英文数据，涵盖30多种语言，训练数据量是前代Llama 2的七倍。

根据Meta的测试结果，Llama 3 8B模型在MMLU、GPQA、HumanEval等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct，70B模型则超越了名声在外的闭源模型Claude 3的中间版本Sonnet，和谷歌的Gemini Pro 1.5相比三胜两负。

实际上板结果

目前AX650N已经完成了Llama 3 8B Int8版本的适配，若采用Int4量化，每秒token数还能再翻一倍，能满足正常的人机交流。

Phi-3

Llama 3刚发布没多久，竞争对手就来了，而且是可以在手机上运行的小体量模型。

本周二，微软发布了自研小尺寸模型Phi-3。尽管Phi-3-mini被优化至可部署在手机上，但它的性能可以与Mixtral 8x7B和GPT-3.5等模型相媲美。微软表示，该创新主要在于用了质量更好的训练数据集。

实际上板结果

目前AX650N已经完成了Phi-3-mini Int8版本的适配，已能满足正常的人机交流。

其他成果

AX650N能第一时间完成Llama 3和Phi-3的适配，源于今年以来相关团队悄悄完成了现有NPU工具链针对大语言模型的支持和调优。目前除了Llama 3之外，已经完成了Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等国内外主流的开源大语言模型适配。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NPU

NPU

+关注

关注
2

文章
288

浏览量
18691
爱芯元智

爱芯元智

+关注

关注
1

文章
82

浏览量
4852
LLM

LLM

+关注

关注
0

文章
298

浏览量
360
AI大模型

AI大模型

+关注

关注
0

文章
320

浏览量
337

原文标题：爱芯通元NPU完成Llama 3和Phi-3大模型适配，推动AI大模型技术应用普及

文章出处：【微信号：爱芯元智AXERA，微信公众号：爱芯元智AXERA】欢迎添加关注！文章转载请注明出处。

在算力魔方上本地部署Phi-4模型

作者：算力魔方创始人/英特尔边缘计算创新大使刘力前面我们分享了《Meta重磅发布Llama 3.3 70B：开源AI模型的新里程碑》，Llama 3.3 70B

发表于 01-15 11:05 •11次阅读

在算力魔方上本地部署<b class='flag-5'>Phi</b>-4<b class='flag-5'>模型</b>

Llama 3 与开源AI模型的关系

在人工智能（AI）的快速发展中，开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新，还促进了全球开发者社区的合作。

发表于 10-27 14:42 •407次阅读

Llama 3 模型与其他AI工具对比

Llama 3模型与其他AI工具的对比可以从多个维度进行，包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对

发表于 10-27 14:37 •449次阅读

Llama 3 模型训练技巧

Llama 3 模型，假设是指一个先进的人工智能模型，可能是一个虚构的或者是一个特定领域的术语。 1. 数据预处理数据是任何机器学习模型的

发表于 10-27 14:24 •371次阅读

Llama 3 与 GPT-4 比较

随着人工智能技术的飞速发展，我们见证了一代又一代的AI模型不断突破界限，为各行各业带来革命性的变化。在这场技术竞赛中，Llama

发表于 10-27 14:17 •411次阅读

Llama 3 语言模型应用

在人工智能领域，语言模型的发展一直是研究的热点。随着技术的不断进步，我们见证了从简单的关键词匹配到复杂的上下文理解的转变。一、Llama 3 语言

发表于 10-27 14:15 •305次阅读

在英特尔酷睿Ultra7处理器上优化和部署Phi-3-min模型

2024年4月23日，微软研究院公布Phi-3系列AI大模型，包含三个版本：mini(3.8B参数)、small(7B参数)以及medium(14B参数)。phi-3-mini是一个拥

发表于 08-30 16:58 •671次阅读

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

借助 NVIDIA AI Foundry，企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron 模型配对，来构建“超级模型” NVIDIA

发表于 07-24 09:39 •729次阅读

微软发布视觉型AI新模型：Phi-3-vision

　据悉，Phi-3-vision 作为微软 Phi-3 家族的首款多模态模型，继承自 Phi-3-mini 的文本理解能力，兼具轻巧便携特性，适用于移动平台/嵌入式终端；

发表于 05-27 15:56 •513次阅读

英特尔优化AI产品组合，助力微软Phi-3家族模型

近日，英特尔宣布针对微软的Phi-3家族开放模型，成功验证并优化了其跨客户端、边缘及数据中心的AI产品组合。这一重要举措旨在提供更为灵活和高效的AI解决方案。

发表于 05-27 11:47 •694次阅读

英特尔与微软合作在其AI PC及边缘解决方案中支持多种Phi-3模型

近日，英特尔针对微软的多个Phi-3家族的开放模型，验证并优化了其跨客户端、边缘和数据中心的AI产品组合。

发表于 05-27 11:15 •604次阅读

Meta Llama 3基础模型现已在亚马逊云科技正式可用

亚马逊云科技近日宣布，Meta公司最新发布的两款Llama 3基础模型——Llama 3 8B和Llam

发表于 05-09 10:39 •425次阅读

英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

英特尔丰富的AI产品——面向数据中心的至强处理器，边缘处理器及AI PC等产品为开发者提供最新的优化，助力其运行Meta新一代大语言模型Meta Llama

发表于 04-28 11:16 •672次阅读

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库，用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言模型推理

发表于 04-28 10:36 •605次阅读

Meta推出最强开源模型Llama 3 要挑战GPT

Meta推出最强开源模型Llama 3 要挑战GPT Facebook母公司Meta Platforms（META.US）推出了开源AI大模型

发表于 04-19 17:00 •867次阅读

搜索历史

爱芯通元NPU完成Llama 3和Phi-3大模型适配，推动AI大模型技术普及

评论

在算力魔方上本地部署Phi-4模型

Llama 3 与开源AI模型的关系

Llama 3 模型与其他AI工具对比

Llama 3 模型训练技巧

Llama 3 与 GPT-4 比较

Llama 3 语言模型应用

在英特尔酷睿Ultra7处理器上优化和部署Phi-3-min模型

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

微软发布视觉型AI新模型：Phi-3-vision

英特尔优化AI产品组合，助力微软Phi-3家族模型

英特尔与微软合作在其AI PC及边缘解决方案中支持多种Phi-3模型

Meta Llama 3基础模型现已在亚马逊云科技正式可用

英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

Meta推出最强开源模型Llama 3 要挑战GPT