0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm与ExecuTorch合作加速端侧生成式AI实现

Arm社区 来源:Arm社区 2024-11-15 11:30 次阅读

作者:Arm 战略与生态部人工智能开发者平台与服务高级副总裁 Alex Spinelli

通过 Arm 计算平台与 ExecuTorch 框架的结合,使得更小、更优化的模型能够在边缘侧运行,加速边缘侧生成式 AI 的实现。

新的 Llama 量化模型适用于基于 Arm 平台的端侧和边缘侧 AI 应用,可减少内存占用,提高精度、性能和可移植性。

全球 2,000 万名 Arm 开发者能够更迅速地在数十亿台边缘侧设备上大规模开发和部署更多的智能 AI 应用。

Arm 正在与 Meta 公司的 PyTorch 团队携手合作,共同推进新的 ExecuTorch 测试版 (Beta) 上线,旨在为全球数十亿边缘侧设备和数百万开发者提供人工智能 (AI) 和机器学习 (ML) 功能,进而确保 AI 真正的潜力能被最广泛的设备和开发者所使用。

借助 ExecuTorch 和新的 Llama 量化模型,Arm 计算平台优化生成式 AI 性能

Arm 计算平台无处不在,为全球众多边缘侧设备提供支持,而 ExecuTorch 则是专为移动和边缘侧设备部署 AI 模型而设计的 PyTorch 原生部署框架。两者的紧密合作,使开发者能够赋能更小、更优化的模型,包括新的 Llama 3.2 1B 和 3B 量化模型。这些新模型可以减少内存占用、提高准确性、增强性能和提供可移植性,成为小型设备上的生成式 AI 应用的理想选择,如虚拟聊天机器人、文本摘要和 AI 助手。

开发者无需额外的修改或优化,便可将新的量化模型无缝集成到应用中,从而节省时间和资源。如此一来,他们能够迅速在广泛的 Arm 设备上大规模开发和部署更多的智能 AI 应用。

随着 Llama 3.2 大语言模型 (LLM) 新版本的发布,Arm 正在通过 ExecuTorch 框架优化 AI 性能,使得在 Arm 计算平台边缘设备运行的真实生成式 AI 工作负载能更为快速。在 ExecuTorch 测试版发布的首日起,开发者便能享有这些性能的提升。

集成 KleidiAI,加速端侧生成式 AI 的实现

在移动领域,Arm 与 ExecuTorch 的合作意味着众多生成式 AI 应用,如虚拟聊天机器人、文本生成和摘要、实时语音和虚拟助手等,完全能够在搭载 Arm CPU 的设备上以更高的性能运行。这一成果得益于 KleidiAI,它引入了针对 4 位量化优化的微内核,并通过 XNNPACK 集成到了 ExecuTorch 中,因此,在 Arm 计算平台上运行 4 位量化的 LLM 时,无缝加速 AI 工作负载的执行。例如,通过 KleidiAI 的集成,Llama 3.2 1B 量化模型预填充阶段的执行速度可以提高 20%,使得一些基于 Arm 架构的移动设备上的文本生成速度超过了每秒 400 个词元 (token)。这意味着,终端用户将从他们移动设备上获得更快速、响应更灵敏的 AI 体验。

物联网的边缘侧 AI 应用加速实时处理能力

在物联网领域,ExecuTorch 将提高边缘侧 AI 应用的实时处理能力,包括智能家电、可穿戴设备以及自动零售系统等。这意味着物联网设备和应用能够以毫秒级的速度响应环境变化,这对保障安全性和功能可用性至关重要。

ExecuTorch 可在 Arm Cortex-A CPU 和 Ethos-U NPU 上运行,以加速边缘侧 AI 应用的开发和部署。事实上,通过将 ExecuTorch 与 Arm Corstone-320 参考平台(也可作为仿真固定虚拟平台 (FVP) 使用)、Arm Ethos-U85 NPU 驱动程序和编译器支持集成到一个软件包中,开发者可在平台上市前几个月就着手开发边缘侧 AI 应用。

更易获取、更快捷的边缘侧 AI 开发体验

ExecuTorch 有潜力成为全球最受欢迎的高效 AI 和 ML 开发框架之一。通过将应用最广泛的 Arm 计算平台与 ExecuTorch 相结合,Arm 正在通过新的量化模型加速 AI 的普及,让开发者能够更快地在更多设备上部署应用,并将更多生成式 AI 体验引入边缘侧。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9034

    浏览量

    366629
  • AI
    AI
    +关注

    关注

    87

    文章

    29928

    浏览量

    268233
  • 人工智能
    +关注

    关注

    1791

    文章

    46738

    浏览量

    237309

原文标题:ExecuTorch 测试版上线,加速 Arm 平台边缘侧生成式 AI 发展

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中科创达发开创智能新篇章

    生成AI在创新和应用方面以前所未有的速度向前发展。融合云计算和边缘/计算的混合AI技术,
    的头像 发表于 11-17 11:23 236次阅读

    从Apple Intelligence到IoT Intelligence,生成AI时代加速到来

    快速运行以AppleIntelligence为中心的生成AI功能在手机运行。用库克的话说:“新一代iPhone彻彻底底为AppleIn
    的头像 发表于 09-11 08:01 632次阅读
    从Apple Intelligence到IoT Intelligence,<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>时代<b class='flag-5'>加速</b>到来

    GE医疗与亚马逊云科技达成战略合作,通过生成AI加速医疗健康领域转型

    GE医疗已选择亚马逊云科技作为其战略云服务合作伙伴,致力于推出全新的定制化基础模型,加速创新医疗应用快速开发。   GE医疗将利用亚马逊云科技的机器学习和生成
    发表于 08-29 16:38 256次阅读

    NVIDIA推出NVIDIA AI Computing by HPE加速生成 AI 变革

    简化 AI 创造价值的过程,加速生成 AI 的发展步伐。 NVIDIA AI Computin
    的头像 发表于 06-20 17:36 668次阅读

    IBM与SAP深化生成AI领域合作

    近日,IBM与SAP宣布将进一步扩大他们的合作范围,共同在生成人工智能(AI)领域进行深度探索。此次合作的核心在于,双方将共同为SAP的R
    的头像 发表于 05-13 09:19 434次阅读

    联发科天玑9300+登场,生成AI刷新业界最高速

    联发科旗舰芯的新一代力作,天玑9300+秉承了天玑系列的突破创新精神,不仅延续了先进的全大核架构和强大的生成AI能力,更是首次在
    的头像 发表于 05-08 21:24 1080次阅读
    联发科天玑9300+登场,<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>刷新业界最高速

    Arm平台赋能移动生成AI

    生成人工智能 (Generative AI) 涵盖了当下广为人知,且备受关注的大语言模型 (LLM),如今也已落地边缘的移动设备。
    的头像 发表于 04-26 11:09 758次阅读

    Arm推动生成AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

    电子发烧友网报道(文/黄晶晶)在嵌入领域,边缘与AI推理需求不断增长,Arm既有Helium 技术使 CPU 能够执行更多计算密集型的
    的头像 发表于 04-16 09:10 4497次阅读
    <b class='flag-5'>Arm</b>推动<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>落地边缘!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器支持Transformer 架构,性能提升四倍

    NVIDIA生成AI研究实现在1秒内生成3D形状

    NVIDIA 研究人员使 LATTE3D (一款最新文本转 3D 生成 AI 模型)实现双倍加速
    的头像 发表于 03-27 10:28 459次阅读
    NVIDIA<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>研究<b class='flag-5'>实现</b>在1秒内<b class='flag-5'>生成</b>3D形状

    SAP与NVIDIA携手加速生成AI在企业应用中的普及

    SAP SE 和 NVIDIA 宣布深化合作,致力于加速企业客户在 SAP 云解决方案和应用组合中利用数据和生成 AI 的变革力量。
    的头像 发表于 03-22 10:02 560次阅读

    生成AI加速向终端演进,NPU、异构计算提供强大算力支持

    的400亿美元,增长至2032年的1.3万亿美元,年复合增速达到42%。   生成AI 向终端快速演进   当前大部分生成
    的头像 发表于 03-16 00:16 2805次阅读

    博世与微软合作开发生成AI产品

    全球知名科技公司博世与微软联合宣布,双方已建立合作关系,共同致力于开发先进的生成AI产品。这一合作的核心目标在于通过利用
    的头像 发表于 03-05 11:17 823次阅读

    智能手机+生成AI,联发科天玑8300加速其普及

    的陆续发布直接成为了生成AI 的落地的助推器。   天玑8300主打冰峰能效,超神进化。天玑 8300 采用台积电第二代 4nm 制程
    的头像 发表于 11-22 16:07 1377次阅读
    智能手机+<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>,联发科天玑8300<b class='flag-5'>加速</b>其普及

    MediaTek 发布天玑 8300 移动芯片,全面革新推动生成 AI 创新

    MediaTek 发布天玑 8300 5G 生成 AI 移动芯片,将天玑的旗舰级体验引入天玑 8000 系列,赋能高端智能手机 AI 创新。作为天玑 8000 系列家族的新成员,天玑
    的头像 发表于 11-21 20:30 503次阅读
    MediaTek 发布天玑 8300 移动芯片,全面革新推动<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 创新

    MediaTek发布天玑8300移动芯片,全面革新推动生成AI创新

    8300拥有先进的生成AI技术与高能效特性,并且游戏体验出色,同时具备高速稳定的网络连接能力。 MediaTek 无线通信事业部副总经理李彦辑博士表示:“MediaTek天玑 8000 系列致力于将旗舰使用体验带给更多用户。
    发表于 11-21 16:01 1235次阅读
    MediaTek发布天玑8300移动芯片,全面革新推动<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>创新