0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

爱芯通元NPU完成Llama 3和Phi-3大模型适配,推动AI大模型技术普及

爱芯元智AXERA 来源:爱芯元智AXERA 2024-04-26 16:57 次阅读

背景

AI大模型技术的持续进步正在推动千行百业智能化升级。近日,Meta、Microsoft相继发布具有里程碑意义的Llama 3系列和Phi-3系列模型,其中Llama 3包括8B、70B两种规格,Phi-3包括mini(3.8B)、small(7B)、medium(14B)三种规格。为了进一步给开发者提供更多尝鲜,爱芯元智的NPU工具链团队迅速响应,已基于AX650N平台完成 Llama 3 8B和Phi-3-mini模型适配。

Llama 3

上周五,Meta发布了Meta Llama 3系列语言模型(LLM),具体包括一个8B模型和一个70B模型在测试基准中,Llama 3模型的表现相当出色,在实用性和安全性评估中,与那些市面上流行的闭源模型不相上下。

ef8a8238-03a9-11ef-a297-92fbcf53809c.png

在架构层面,Llama 3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3使用了超过15T的公开数据进行训练,其中5%为非英文数据,涵盖30多种语言,训练数据量是前代Llama 2的七倍。

根据Meta的测试结果,Llama 3 8B模型在MMLU、GPQA、HumanEval等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct,70B模型则超越了名声在外的闭源模型Claude 3的中间版本Sonnet,和谷歌的Gemini Pro 1.5相比三胜两负。

efa71060-03a9-11ef-a297-92fbcf53809c.png

实际上板结果

目前AX650N已经完成了Llama 3 8B Int8版本的适配,若采用Int4量化,每秒token数还能再翻一倍,能满足正常的人机交流。

Phi-3

Llama 3刚发布没多久,竞争对手就来了,而且是可以在手机上运行的小体量模型。

本周二,微软发布了自研小尺寸模型Phi-3。尽管Phi-3-mini被优化至可部署在手机上,但它的性能可以与Mixtral 8x7B和GPT-3.5等模型相媲美。微软表示,该创新主要在于用了质量更好的训练数据集。

efcbd13e-03a9-11ef-a297-92fbcf53809c.jpg

efe2ec48-03a9-11ef-a297-92fbcf53809c.png

实际上板结果

目前AX650N已经完成了Phi-3-mini Int8版本的适配,已能满足正常的人机交流。

其他成果

AX650N能第一时间完成Llama 3和Phi-3的适配,源于今年以来相关团队悄悄完成了现有NPU工具链针对大语言模型的支持和调优。目前除了Llama 3之外,已经完成了Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等国内外主流的开源大语言模型适配。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NPU
    NPU
    +关注

    关注

    2

    文章

    274

    浏览量

    18561
  • 爱芯元智
    +关注

    关注

    1

    文章

    77

    浏览量

    4822
  • LLM
    LLM
    +关注

    关注

    0

    文章

    279

    浏览量

    310
  • AI大模型
    +关注

    关注

    0

    文章

    309

    浏览量

    295

原文标题:爱芯通元NPU完成Llama 3和Phi-3大模型适配,推动AI大模型技术应用普及

文章出处:【微信号:爱芯元智AXERA,微信公众号:爱芯元智AXERA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Llama 3 与开源AI模型的关系

    在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动技术的创新,还促进了全球开发者社区的合作。
    的头像 发表于 10-27 14:42 334次阅读

    Llama 3 模型与其他AI工具对比

    Llama 3模型与其他AI工具的对比可以从多个维度进行,包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对
    的头像 发表于 10-27 14:37 318次阅读

    Llama 3 模型训练技巧

    Llama 3 模型,假设是指一个先进的人工智能模型,可能是一个虚构的或者是一个特定领域的术语。 1. 数据预处理 数据是任何机器学习模型
    的头像 发表于 10-27 14:24 249次阅读

    Llama 3 与 GPT-4 比较

    随着人工智能技术的飞速发展,我们见证了一代又一代的AI模型不断突破界限,为各行各业带来革命性的变化。在这场技术竞赛中,Llama
    的头像 发表于 10-27 14:17 289次阅读

    Llama 3 语言模型应用

    在人工智能领域,语言模型的发展一直是研究的热点。随着技术的不断进步,我们见证了从简单的关键词匹配到复杂的上下文理解的转变。 一、Llama 3 语言
    的头像 发表于 10-27 14:15 244次阅读

    在英特尔酷睿Ultra7处理器上优化和部署Phi-3-min模型

    2024年4月23日,微软研究院公布Phi-3系列AI模型,包含三个版本:mini(3.8B参数)、small(7B参数)以及medium(14B参数)。phi-3-mini是一个拥
    的头像 发表于 08-30 16:58 557次阅读
    在英特尔酷睿Ultra7处理器上优化和部署<b class='flag-5'>Phi-3</b>-min<b class='flag-5'>模型</b>

    微软发布视觉型AI模型Phi-3-vision

     据悉,Phi-3-vision 作为微软 Phi-3 家族的首款多模态模型,继承自 Phi-3-mini 的文本理解能力,兼具轻巧便携特性,适用于移动平台/嵌入式终端;
    的头像 发表于 05-27 15:56 453次阅读

    英特尔优化AI产品组合,助力微软Phi-3家族模型

    近日,英特尔宣布针对微软的Phi-3家族开放模型,成功验证并优化了其跨客户端、边缘及数据中心的AI产品组合。这一重要举措旨在提供更为灵活和高效的AI解决方案。
    的头像 发表于 05-27 11:47 648次阅读

    英特尔与微软合作在其AI PC及边缘解决方案中支持多种Phi-3模型

    近日,英特尔针对微软的多个Phi-3家族的开放模型,验证并优化了其跨客户端、边缘和数据中心的AI产品组合。
    的头像 发表于 05-27 11:15 552次阅读

    Meta Llama 3基础模型现已在亚马逊云科技正式可用

    亚马逊云科技近日宣布,Meta公司最新发布的两款Llama 3基础模型——Llama 3 8B和Llam
    的头像 发表于 05-09 10:39 380次阅读

    英特尔AI产品助力其运行Meta新一代大语言模型Meta Llama 3

    英特尔丰富的AI产品——面向数据中心的至强处理器,边缘处理器及AI PC等产品为开发者提供最新的优化,助力其运行Meta新一代大语言模型Meta Llama
    的头像 发表于 04-28 11:16 597次阅读

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言模型推理
    的头像 发表于 04-28 10:36 504次阅读

    Meta推出最强开源模型Llama 3 要挑战GPT

    Meta推出最强开源模型Llama 3 要挑战GPT Facebook母公司Meta Platforms(META.US)推出了开源AI模型
    的头像 发表于 04-19 17:00 815次阅读

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    和语法规则,将这些词汇串联起来,形成一个完整的回答 关于LLaMALLaMA.cpp LLaMA全称是Large Language Model Meta AI,是由Meta
    发表于 12-22 10:18

    派 Pro 开发板试用体验】部署派官方YOLOV5模型

    、总结 得益于官方案例,开发者可以很方便的在智SoC硬件平台上部署常见的深度学习算法模型,方便开发者快速评估和适配业务。
    发表于 12-12 22:58