0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2025年1000亿!Arm立了一个小目标!

RISCV国际人才培养认证中心 2024-12-17 16:43 次阅读

在近日深圳召开的以 “让我们携手重塑未来” 为主题的Arm Tech Symposia年度技术大会”上,Arm 终端事业部产品管理副总裁 James McNiven 莅临现场发表了热情洋溢的讲话,并透露了Arm立下的一个小目标:到2025 年底,全球将有超过 1,000 亿台具备 AI 能力的 Arm 设备。这个1000亿目标可以实现吗?

f64e70cc-bc52-11ef-8084-92fbcf53809c.jpg

James McNiven 强调Arm一直深耕算力技术的发展,Arm在算力的探索最早可以从ARMv7 架构(Cortex-A 系列)中引入的NEON 开始,NEON 是 ARM 处理器架构中的一个高级 SIMD(Single Instruction Multiple Data,单指令多数据)指令集扩展,主要用于加速多媒体和信号处理任务,如图像处理、音频解码、视频编解码、以及机器学习推理等工作负载。

f66b0e44-bc52-11ef-8084-92fbcf53809c.jpg

NEON 的设计目标是提供高能效的向量化计算能力,使嵌入式设备能够高效处理复杂的多媒体任务,同时保持较低功耗。到2011年Arm发布ARMv8架构,NEON 进一步优化,用于提升多媒体和信号处理任务的性能,如图像处理、音频处理、以及 DSP 算法加速。ARMv8 是首个全面支持 64 位运算的架构。NEON 指令的寄存器扩展为 32 个 128 位寄存器,适配 64 位数据路径。在 ARMv8 NEON 中,支持更多整数和浮点操作,使得音频解码和视频编解码的效率显著提升。在ARMv8.1-A架构上面向 HPC(高性能计算)和 AI 加速的需求,Arm首次引入 了SVE(Scalable Vector Extension),这是 NEON 之后的一个重要向量扩展。可扩展向量长度支持 128 位到 2048 位的动态向量长度,适应不同算力需求。SVE 针对矩阵运算、机器学习和科学计算进行了优化,特别适合向量密集型任务。

此外,它还提高了计算资源的可移植性,从移动设备到云端计算均有支持。随着 AI 和机器学习任务对计算需求的增长,2021 年发布的ARMv9 架构加强了向量处理能力,引入 MVE 和 SVE2,MVE(Helium)针对 Cortex-M 系列的向量扩展,优化了嵌入式低功耗设备的算力,适用于物联网、边缘计算中需要高能效的工作负载。SVE2在 SVE 的基础上增强了对 AI 和 DSP 的支持。新增支持 bit-manipulation 和矩阵运算的指令集,专为 AI 推理和 5G 基站设计。这一时期,ARM 的算力架构不仅限于 CPU,还整合了 GPU 计算加速,如 Mali 系列和最新的 Immortalis 系列,逐渐融合 CPU 和 GPU 算力。与 NEON/SVE 协同工作,GPU 负责并行计算任务,而 CPU 处理串行任务。随着AI 和机器学习的崛起,ARM 针对数据中心推出了 Neoverse 系列(如 Neoverse N2 和 V2),引入增强的矩阵运算能力。它专为推理加速设计,如在边缘计算和云服务中运行 AI 模型。在新架构中加入对 INT8 和 BF16 的高效支持,显著提升推理性能。James McNiven 强调Armv9 作为 Arm 最新的技术架构,推出伊始便是为支撑 AI 计算而设计,并持续迭代更新,通过 SVE、SVE2、SME 等关键技术,Arm 以架构创新和强大的软硬件协同能力不断优化移动端 AI 体验,赋能开发者实现卓越的 AI 性能。

f67e542c-bc52-11ef-8084-92fbcf53809c.jpg

在会后的媒体采访中,James表示要把握 AI 的发展机遇。Arm 通过采用系统级设计思维,专注硬件与软件协同优化,面向不同应用市场推出计算子系统 (CSS),扩展底层技术并巩固 AI 计算需求。与此同时,Arm 持续投资创新软件技术,为全球 2,000 万开发者提供从云到端的高效、易用、无缝开发体验。此外,Arm 还通过包括全面设计 (Arm Total Design) 在内的众多生态项目,协助合作伙伴加速产品上市进程。f68e9bf2-bc52-11ef-8084-92fbcf53809c.jpg

f69cc754-bc52-11ef-8084-92fbcf53809c.jpg

据介绍,目前全球有超过 2,000 万名软件开发者在基于 Arm 架构的设备上构建应用,软件话题也成为本次年度技术大会的焦点之一。Arm 在软件方面的持续投入已取得显著成效,正建立起全球最大的 AI 开发者社区。本届大会首度举办的开发者工作坊收获了参与者的热烈响应,围绕 Windows on Arm 原生应用、安卓系统上的 LLM 推理、生成式 AI 加速等开发者最为关注的主题,工作坊为开发者提供了直观的技术体验,激发开发者创新潜力的同时,也为相关应用开发增添了新的动力。

f6c670d6-bc52-11ef-8084-92fbcf53809c.jpg

笔者注意到现场工程师对ARM 的 ONELab有浓厚的兴趣,据ARM介绍ONELab是 ARM 针对开发者和企业推出的一个端到端 AI 开发与优化平台,其目标是帮助开发者快速、高效地开发、优化和部署 AI 应用程序,尤其是在 ARM 架构上运行的设备中。据介绍,ONELab 的核心在于提供一套集成工具链和开发环境,专注于 AI 应用的优化与部署,它可以提供跨平台开发支持,涵盖移动端(如智能手机)、嵌入式设备(如 IoT 设备)和数据中心(如 ARM Neoverse 服务器)。

支持主流的深度学习框架,如 TensorFlow、PyTorch 和 ONNX,通过兼容性的 API,开发者可以无缝迁移现有的 AI 模型。它针对 ARM 设备中的 CPU(Cortex 系列)、GPU(Mali 系列)和 NPU(神经网络处理单元) 进行优化。它还可以自动调用底层硬件加速特性,例如 NEON SIMD、SVE2 向量扩展,以及 Mali GPU 的并行计算能力。在多核环境下分配计算任务,它可使模型能够在 CPU、GPU 和 NPU 之间高效运行。提供任务调度机制,针对不同类型的计算任务(如卷积、矩阵运算)动态分配资源。ONELab 主要专注于以下几个领域的 AI 应用开发:

1、边缘 AI:物联网设备:通过 Cortex-M 系列低功耗 CPU 和 Helium 向量扩展(MVE)加速嵌入式推理。实时分析:在摄像头、传感器等设备中,实现实时的视觉和语音识别

2、移动设备:智能手机:通过 Mali GPU 和 CPU 的协作优化,提供高效的图像分类、增强现实(AR)和语音助手功能,优化设备端的 AI 模型性能,同时降低功耗。

3 数据中心和高性能计算:云端推理:结合 Neoverse 平台,为 AI 推理任务提供高吞吐量和低延迟的解决方案。HPC(高性能计算):支持在超级计算机或集群中部署 AI 应用,面向深度学习训练和科学计算。

4、自动驾驶工业自动驾驶:优化感知算法和决策系统,利用 ARM 平台实现实时推理。工业自动化:为机器人和工业设备中的边缘推理提供算力支持。未来,在提升算力方面Arm的SVE3 可能会加入对更复杂的 AI 和 HPC 工作负载的支持。此外,向量计算扩展将继续优化能效比,为移动和服务器市场服务。而随着 AI 和机器学习的重要性增加,ARM 可能推出更多带有 TPU 类特性的专用单元,进一步缩小与竞争对手(如 NVIDIA 和 Intel)的差距,成为多领域算力需求的重要支柱。James表示Arm 通过将 IP 与开源软件和工具乃至广泛的行业领先生态系统相结合,让全球 2,000 万开发者都能够使用 Arm 计算平台作为 AI 创新基础。有了生态伙伴的大力支持因此Arm 敢大胆地预测到 2025 年底,全球将有超过 1,000 亿台具备 AI 能力的 Arm 设备。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19242

    浏览量

    229593
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9079

    浏览量

    367293
  • AI
    AI
    +关注

    关注

    87

    文章

    30643

    浏览量

    268822
收藏 人收藏

    评论

    相关推荐

    Arm 年度技术大会: 预计2025 年底,全球将有超过 1,000 亿台具备 AI 能力的 Arm 设备

    。值得提的是,在生态伙伴的携手合作下,Arm预计到2025底,全球将有超过1,000亿台具备AI能力的
    的头像 发表于 11-22 12:41 245次阅读
    <b class='flag-5'>Arm</b> 年度技术大会: 预计<b class='flag-5'>2025</b> 年底,全球将有超过 1,000 <b class='flag-5'>亿</b>台具备 AI 能力的 <b class='flag-5'>Arm</b> 设备

    文看懂2025功率半导体市场展望

    。我们估计了 2025 最有趣的重点领域。 1. 赋能数据中心未来 在人工智能的持续发展推动下,数据中心市场正在经历场巨大的转变。随着计算半导体市场到 2025
    的头像 发表于 11-22 11:02 827次阅读
    <b class='flag-5'>一</b>文看懂<b class='flag-5'>2025</b><b class='flag-5'>年</b>功率半导体市场展望

    台积电2025将全球建十座厂,资本支出创历史新高

    据台媒报道,台积电在半导体业界的扩张步伐再次加速。2025,包含在建与新建厂案,台积电海内外建厂总数将达到10,这数字不仅创下了该公司历史新高,更在全球范围内树
    的头像 发表于 11-19 17:34 460次阅读

    英伟达计划2025推出基于Arm架构的消费级CPU,挑战英特尔和AMD

    11月5日,据科技媒体DigiTimes于10月31日报道,供应链消息透露,英伟达(Nvidia)正计划在20259月推出其首款基于Arm架构的消费级CPU,目标直指高端PC市场。
    的头像 发表于 11-05 15:29 618次阅读

    Omdia:亚太区生成式人工智能将在2025增长到242亿

    Omdia报告指出,中国大模型市场历经二十个月的演变,已摆脱初期的混沌状态,各大厂商的战略布局日益明朗,预示着新轮增长期的到来。据Omdia预测,亚太地区生成式人工智能市场规模将在2025达到242
    的头像 发表于 10-29 15:21 389次阅读

    ARM财季表现强劲 净利润同比大增112%超出分析师预期

    ARM公司再创佳绩,在第财季ARM公司营收达到9.39亿美元;重要的是净利润同比大增112%。 根据ARM公司公布的截至
    的头像 发表于 08-01 16:58 939次阅读

    Arm预计未来五将有1000亿台设备用于AI

    在COMPUTEX 2024展前活动中,Haas详解了其公司计划如何在2025前,将逾千亿台Arm架构设备投入人工智能(AI)应用,涵盖从云端到边缘侧的各个环节。
    的头像 发表于 06-06 16:29 636次阅读

    ARM:AI时代的创新驱动,有望夺下Windows PC市场50%

    在COMPUTEX 2024展会期间,半导体IP巨头Arm召开了主题为“加速云至边缘AI创新”的演讲。他们预计,到2025底,全球将有超过1000
    的头像 发表于 06-05 17:18 671次阅读

    Arm目标内赢取过半Windows PC市场份额

    在全球计算机技术的竞争格局中,Arm公司CEO Rene Haas近日公布了其雄心勃勃的目标:五内赢得超过50%的Windows PC市场份额。与此同时,微软及其硬件合作伙伴正积极准备推出基于
    的头像 发表于 06-04 14:36 628次阅读

    上海特斯拉超级储能工厂开工,预计2025季度投产

    此项计划预计将于 2025 季度完工并投入使用,届时将有能力生产出 1 万套Megapack超大型电化学商用储能系统,总储能规模达到近 40 吉瓦时(1 吉瓦时为 1000 兆瓦
    的头像 发表于 05-23 15:35 431次阅读

    Arm计划2025大规模销售AI芯片

    软银集团旗下的英国芯片巨头Arm近日公布了其雄心勃勃的AI芯片销售计划。该公司宣布,计划到2025实现AI芯片的大规模销售,以进步巩固其在全球芯片市场的领先地位。
    的头像 发表于 05-20 10:48 603次阅读

    软银孙正义拟投资640亿美元转型,Arm计划2025推出AI芯片

    软银集团子公司Arm将进军人工智能(AI)芯片的开发,寻求在2025推出首批产品。
    的头像 发表于 05-14 11:27 744次阅读

    Arm预计2025推出首款AI芯片

    全球知名的芯片设计公司安谋(Arm Holdings)正在积极筹划其首款AI芯片的研发,预计于2025正式推向市场。为了实现这一目标Arm
    的头像 发表于 05-14 11:10 650次阅读

    软银集团挺进AI芯片领域,立志2025量产

    Arm将在英国设立AI芯片部门,争取在2025春季前完成原型设计。同年秋天,预计将由合约制造商展开大规模生产。Arm目前为英伟达等知名芯片开发商提供架构设计服务,其智能手机处理器架构
    的头像 发表于 05-13 09:54 407次阅读

    特斯拉Cybertruck或2022交付,高端版本2025

     此举显示,无论是全驱还是高配Cyberbeast(野兽型),预计交付时间均为2025。早前消息透露,特斯拉计划每年生产并交付25万台Cybertruck。然而,马斯克已警示说,这一目标年底难达成,乐观的时间预计是在
    的头像 发表于 04-07 14:46 506次阅读