0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm平台赋能移动端生成式AI

Arm社区 来源:Arm社区 2024-04-26 11:09 次阅读

生成式人工智能 (Generative AI) 涵盖了当下广为人知,且备受关注的大语言模型 (LLM),如今也已落地边缘侧的移动设备。这意味着,无论是生成图像和视频,还是理解上下文语义,AI 的生成式推理将开始由移动设备进行全权处理,而非交由云端处理后返回结果。

Arm 作为基石技术,使得无处不在的 AI 成为可能,其中就包括移动端的生成式 AI。无论是支持 AI 功能的新款旗舰智能手机,还是直接在 Arm CPU 上处理 LLM,这些振奋人心的开发成果都展现了 Arm 作为基石技术的实际应用价值。

AI 赋能的新款智能手机

采用 Armv9 架构的 CPU 和 GPU 技术的高性能 AI 智能手机现已问世,其中包括搭载 MediaTek 天玑 9300 的 vivo X100 和 X100 Pro 智能手机、三星 Galaxy S24 以及谷歌 Pixel 8。

这些旗舰移动设备兼顾性能与效率,为 AI 创新提供了前所未有的机遇。事实上,在过去十年间,得益于 Arm CPU 和 GPU 的性能提升,在移动平台上的 AI 处理能力每两年实现翻番。

未来,我们会将更多 AI 性能、技术和功能加入到我们坚实的消费技术路线图中,推动这一趋势不断发展。同样起助推作用的还有当下的边缘侧 AI 推理热潮,以及使用 LLM 等经过训练的模型来驱动基于 AI 的应用,随着更多的 AI 支持和专用指令的加入,CPU 将成为满足这一需求的理想选择。

一切始于 CPU

大多数情况下,移动设备的 AI 功能都始于 CPU,例如对面部、手部和身体动作的追踪,高级的相机效果和滤镜,以及许多社交应用中的细分功能。此类 AI 工作负载的处理可能全权交由 CPU,或是结合 GPU 或 NPU 等协处理器一起提供支持。Arm 的 CPU 设计广泛应用于当今全球数十亿人使用的智能手机系统级芯片 (SoC) 中,对于在终端设备实现 AI 工作负载至关重要。

目前,70% 的第三方应用所使用的 AI 均基于 Arm CPU 运行,包括新发布的社交类、健康类和基于相机功能的应用等。除了设计的普及性,Arm CPU 还具有灵活性和 AI 功能,因此成为了移动设备领域开发者首选的应用 AI 工作负载处理器。

就灵活性而言,Arm CPU 能够以多种数据格式运行各类神经网络。展望未来,未来的 Arm CPU 将在指令集中加入更多 AI 功能,惠及行业领先的 Arm 生态系统,例如适用于 Armv9-A 架构的可扩展矩阵扩展 (Scalable Matrix Extension, SME),帮助全球开发者为其 AI 应用提供更高的性能、创新功能和可扩展性。

Arm 将领先的硬件水平与软件生态系统支持相结合,打造出高性能计算平台,推动边缘生成式 AI 的兴起,让游戏迭代、图像增强、语言翻译、文本生成和虚拟助手等功能成为可能。我们在今年二月的 2024 世界移动通信大会 (MWC 2024)上展示了部分新一代 AI 工作负载的示例。

Arm 计算平台上的移动端 LLM

我们制作了一个虚拟助手演示,在移动端聊天类应用上使用了 Meta 的 LLAMA2-7B LLM。基于 Arm CPU,无需加速器,即可完全在边缘侧移动设备上运行生成式 AI 工作负载。利用现有的针对 AI 的 CPU 指令,结合 Arm 计算平台(包括 Arm AI 软件库)针对 LLM 的专门的软件优化,我们实现了出色的性能表现。

从上面的视频中可以看出,词元 (Token) 首次响应时间表现优异,文本生成速率接近每秒 10 个词元,高于人们的平均阅读速度。这得益于经过高度优化的 CPU 例程,它来自于由 Arm 工程团队开发的软件库;与 LLAMA2-7B LLM 中的原生实现相比,词元首次响应时间缩短 50%,文本生成速率提高 20%。

此外,AI 开发者也可在 Arm CPU 上利用自己的技术,进一步优化软件,让 LLM 变得更小、更高效、更快速。

LLM 越小、越快,就意味着 AI 处理可以在边缘侧进行。用户可以享受到响应更快、更灵敏的 AI 体验。此外,由于用户数据仅在移动设备本地处理,隐私保护也能做得更好。同时,对于移动端生态系统而言,这种成本更低、可扩展性更强的选择,也更有利于在数十亿移动设备上部署 AI。

推动移动设备上的生成式 AI

作为最为普及的移动端计算平台和高效计算领域的领导者,Arm 担负着在边缘侧实现高效、高性能生成式 AI 的责任。我们已经展示了完全基于我们领先的 CPU 技术所运行的 LLM 的卓越性能。而这仅仅只是开始。

更小、更高效的 LLM,Arm CPU 为移动设备带来的更高性能,以及由业界领先的生态系统所提供的创新软件优化,三者的结合将继续推动移动端生成式 AI 的普及。

鉴于 Arm CPU 是移动端生成式 AI 创新的核心,作为 AI 的运行基础,Arm 将持续赋能每位开发者,实现无处不在的 AI。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    795

    浏览量

    37740
  • ARM技术
    +关注

    关注

    0

    文章

    22

    浏览量

    7281
  • 人工智能
    +关注

    关注

    1791

    文章

    46820

    浏览量

    237457
  • 大模型
    +关注

    关注

    2

    文章

    2314

    浏览量

    2449
  • 生成式AI
    +关注

    关注

    0

    文章

    487

    浏览量

    458

原文标题:Arm 平台赋能移动端生成式 AI

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    生成AI工具作用

    生成AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此,petacloud.ai小编为您整理
    的头像 发表于 10-28 11:19 165次阅读

    Arm如何无处不在的AI

    作为人工智能 (AI) 的创新基础,众多企业都在使用通用且应用广泛的 Arm 计算平台。迄今为止,合作伙伴基于 Arm 架构的芯片出货量已逾 2,800 亿颗。如今,
    的头像 发表于 09-14 09:38 446次阅读

    亚马逊云科技Shulex打造基于生成AI的客服和消费者洞察

    "Shulex")在亚马逊云科技的技术下,打造基于生成AI的"AI Agent客服机器人"
    的头像 发表于 08-13 20:38 258次阅读

    MediaTek联合快手推出高效侧视频生成技术

    MediaTek 与快手共同宣布,推出高效侧视频生成技术,共同探索并推进生成 AI 技术的革新。作为对 2024 世界
    的头像 发表于 07-05 11:23 4753次阅读

    商汤发布《2024生成AI教育未来》白皮书

    生成AI正在各个行业中展现出巨大的应用前景。在关系国计民生的教育行业,生成AI能够催生哪些创
    的头像 发表于 06-29 09:48 758次阅读

    请问移动生成AI如何在Arm CPU上运行呢?

    2023 年,生成人工智能 (Generative AI) 领域涌现出诸多用例。这一突破性的人工智能 (AI) 技术是 OpenAI 的 ChatGPT 和 Google 的 Gem
    的头像 发表于 05-21 17:07 827次阅读
    请问<b class='flag-5'>移动</b><b class='flag-5'>端</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>如何在<b class='flag-5'>Arm</b> CPU上运行呢?

    玩转大模型 企业AI着陆新正解 神州问学AI原生平台正式发布

    智能未来的坦途。   神州问学——打造“一站AI原生平台 面对TOB业务复杂性和多样性,神州问学致力给出“一站
    的头像 发表于 05-15 16:41 330次阅读
    玩转大模型 企业<b class='flag-5'>AI</b>着陆新正解 神州问学<b class='flag-5'>AI</b>原生<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>平台</b>正式发布

    联发科发布天玑AI开发套件,终端生成AI应用

    联发科近日推出了全新的天玑AI开发套件,旨在为合作伙伴打造一站解决方案,以加速终端生成AI应用的开发。这款套件集合了四大核心模块,为
    的头像 发表于 05-10 11:19 543次阅读

    联发科天玑9300+登场,生成AI刷新业界最高速

    联发科旗舰芯的新一代力作,天玑9300+秉承了天玑系列的突破创新精神,不仅延续了先进的全大核架构和强大的生成AI能力,更是首次在侧实现了Speculative Decoding
    的头像 发表于 05-08 21:24 1083次阅读
    联发科天玑9300+登场,<b class='flag-5'>端</b>侧<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>刷新业界最高速

    MediaTek发布天玑汽车平台新品,智能汽车的体验革新

    MediaTek 发布天玑汽车平台新品,以先进的生成 AI 技术智能汽车的体验革新。天玑汽
    的头像 发表于 04-28 10:02 587次阅读
    MediaTek发布天玑汽车<b class='flag-5'>平台</b>新品,<b class='flag-5'>赋</b><b class='flag-5'>能</b>智能汽车的体验革新

    研华携手群联 共同打造边缘运算与工控应用生成AI平台

    安全可靠&平民化的地GenAI环境   导读: 4月17日,群联电子(Phison)宣布与研华科技(Advantech)携手合作,共同打造GenAI运算平台。该
    发表于 04-26 17:28 232次阅读
    研华携手群联 共同打造边缘运算与工控应用<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>平台</b>

    生成AI手机出货量或将飞速增长,市场份额提升显著

    同时,反转点还预期,至2027年,生成AI智慧型手机的市场保有量将超过10亿部。按照其定义,生成AI
    的头像 发表于 04-16 16:55 592次阅读

    NPU是什么?为何它是开启终端侧生成AI的关键?

    ),同时要利用异构处理器组合,比如中央处理器(CPU)和图形处理器(GPU)。通过结合NPU使用合适的处理器,异构计算能够实现最佳应用性能、效和电池续航,全新增强的生成
    的头像 发表于 03-07 11:25 2026次阅读
    NPU是什么?为何它是开启终端侧<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的关键?

    亚马逊云科技助力沐瞳应用生成AI技术打造卓越游戏体验 业务决策

    北京 ——2024 年 2 月 21 日   亚马逊云科技宣布,上海沐瞳科技有限公司(以下简称“沐瞳”)应用亚马逊云科技Amazon Bedrock等生成AI服务,为玩家打造卓越的游戏体验并
    发表于 02-22 11:20 219次阅读
    亚马逊云科技助力沐瞳应用<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>技术打造卓越游戏体验 <b class='flag-5'>赋</b><b class='flag-5'>能</b>业务决策

    亚马逊云科技助力沐瞳应用生成AI技术打造卓越游戏体验 业务决策

    北京2024年2月21日 /美通社/ -- 亚马逊云科技宣布,上海沐瞳科技有限公司(以下简称"沐瞳")应用亚马逊云科技Amazon Bedrock等生成AI服务,为玩家打造卓越的游戏体验并
    的头像 发表于 02-22 09:25 398次阅读