0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

40+TOPS NPU,AI PC处理器开卷算力

花茶晶晶 来源:电子发烧友 作者:黄晶晶 2024-07-14 01:11 次阅读

电子发烧友网报道(文/黄晶晶)今年初,微软推出引入Copilot功能的全新个人电脑,Copilot作为AI语音助手被确定为AI PC不可或缺的按键以及功能,它能够在不需要云数据中心的情况下处理本地的人工智能任务。同时,微软还提出,这款全新电脑搭配拥有全新神经处理单元NPU的芯片,可实现每秒超过40万亿次即40+TOPS的运算。那么也就是说,若要符合微软给出的AI PC的定义,NPU的算力至少要达到40 TOPS。

这一定义的抛出,突显了NPU的重要性。半导体大厂们普遍认为CPU+GPU+NPU的组合将是AI PC的算力基座。

《AI PC产业白皮书》中指出AI PC五大特性,包括提供多模态自然语言交互、终端内嵌个人的大模型、标配本地混合AI算力、连接开放的AI应用生态、设备级个人数据和隐私安全保护。尤其是本地混合AI算力,即CPU+GPU+NPU异构混合算力保证了AIPC本地推理的可行性,同时随着端侧算力的快速提升,AIPC可以承载更大的AI模型,执行更加复杂的任务。

在分工上,CPU是计算机的运算核心和控制核心,GPU进行图形处理和大规模并发计算,NPU提供高效能和低功耗的神经网络运算支持,在多种应用场景中实用智能计算。三者的组合发挥各自的优势,协同工作,高效实现端侧AI的能力。

不过,当前来看NPU别说是多少算力的问题,甚至很多设备都还没有NPU。以安卓平台来看,目前70%的第三方 ML/AI 应用运行在CPU上,特别是一些低级别设备很难承担NPU的费用,CPU+GPU+NPU的组合或许要从高端设备开始。

AI PC的演进过程中,《白皮书》指出应分为AIReady阶段和AIOn阶段。在AIReady阶段,AIPC主要表现为芯片计算架构的升级,具备基本的本地混合AI算力,能够为AIPC的软件及服务创新提供基本保障,开启体验创新。

如今,NPU以及高算力NPU的导入已经开始。英特尔AMD、苹果、高通厂商纷纷推出了带有NPU的处理器产品,不少新产品的NPU算力都达到40 TOPS,高算力应对复杂且众多的本地AI大模型需求,为迎接AI PC的应用爆发做好准备。

wKgaomaRAZCAdSMgAAJR7zgP_9M166.jpg

英特尔

去年12月,英特尔正式发布酷睿Ultra处理器。它是首款基于 Intel 4 制程工艺打造的处理器,代表了40年来英特尔架构最大的革新。采用了先进的Foveros 3D 封装技术,在 CPU、GPU 和神经网络处理单元(NPU)的架构中集成了专属 AI 加速功能,从而成为英特尔历史上 AI 性能最强、能效最佳的客户端处理器。英特尔方面还宣布,将与主流 OEM 伙伴推出 230 余款机型,开启AI PC新纪元。

根据英特尔的酷睿 Ultra 产品路线图,2023年为Meteor Lake,2024年将有Lunar Lake、Arrow Lake,2025年为Panther Lake,2026年Future Products还没有具体架构代号。其中Lunar Lake采用台积电3nm工艺,NPU性能将是上一代的4倍,达到48 TOPS,满足 Copilot+ 需求。

另外,英特尔将于年内发布Arrow Lake处理器。报道称,Arrow Lake涵盖了台式机和笔记本电脑产品的多个细分平台,其中“S”用于台式机并采用LGA 1851插座,“HX”用于发烧级游戏本,算力方面,Arrow Lake-S和Arrow Lake-HX提供AI算力达37 TOPS,其中Arrow Lake-S/HX的GPU在新架构加持下,AI算力从3 TOPS提高到9 TOPS;内置的NPU提供13 TOPS的AI算力。

AMD

AMD于2023年5月推出的锐龙7040系列是全球首款内置XDNA架构NPU的X86处理器,同年12月推出锐龙8040系列移动处理器,提供高达16TOPS的NPU算力和39 TOPS的整体算力,相较上一代带来60%的AI性能提升。

在今年6月的台北电脑展上,AMD重磅发布了Ryzen AI 300 系列处理器,采用Zen 5架构、第三代AMD Ryzen AI,内置XDNA2 NPU,GPU升级为RDNA 3.5。

wKgaomaRAZyAX8DdAACC5X0tLE8368.jpg

作为一款专为AI PC打造的处理器,其NPU算力可达50 TOPS,相较而言上一代Ryzen 8040系列芯片只有16 TOPS。

可以看到,这款处理器的亮点之一就在于NPU算力的大幅提升。AMD表示,XDNA2 NPU的计算能力提供5倍多,多任务并行能力翻一番,能效提升最多2倍。并且,XDNA2首次引入全新的Block FP16浮点精度,传统的8-bit INT8数据类型性能强但准确性低,16-bit FP16数据类型准确性高但性能弱。FP16 NPU可兼顾两者的性能与准确性,目前大多数AI应用都采用了16-bit精度。另外,AMD已经与超过150家AI赋能的ISV合作伙伴达成深度合作,进而为AMD Ryzen AI提供兼容性更好、性能体验更好的各类型AI应用。

苹果

2023年,苹果A17 Pro处理器对整块芯片进行了全方位提升,包括 Apple 有史以来最大规模重新设计的图形处理器。通过微架构和设计上的改进,全新的中央处理器实现了多达 10% 的速度提升,神经网络引擎的速度也提升多达 2 倍。采用台积电3nm工艺制程,其NPU拥有16核心,性能达到35 TOPS。

今年5月,苹果发布的11英寸和13英寸iPad Pro搭载了M4处理器,该处理器基于台积电第二代3nm工艺,拥有280亿个晶体管,NPU算力从18TOPS提升到38 TOPS。

在前不久的苹果全球开发者大会(WWDC)上,苹果宣布了全新的AI系统Apple Intelligence。要提升系统的AI能力,NPU的升级必不可少。今年9月苹果全新一代iPhone 16 Pro将配备最新的A18芯片,据悉台积电启动2nm芯片试产,苹果A18性能或提升30%,而在NPU性能上,有消息称A18有望超越苹果自家的M4处理器,可能达到45TOPS。


高通

此次微软首批Copilot+PC,搭载高通骁龙(Snapdragon)X Elite 芯片。高通于2023年推出为AI PC设计的骁龙 X Elite 处理器,该处理器集成高通定制 Oryon CPU,基于 4nm 工艺打造,采用 12 颗 3.8GHz 大核,全新 Hexagon NPU 最高可提供 45 TOP(每秒万亿次运算)算力,并且可以在设备上以“惊人的速度”运行超过 13B 参数的生成式 AI LLM(大型语言模型)。首批搭载骁龙X Elite 芯片的PC制造商包括荣耀、联想、小米等。

此外,消息称,联发科英伟达联手研发Arm架构AI PC处理器,新款芯片将对标苹果M4,预计2024年第三季度完成设计,第四季度进入验证阶段,将采用台积电3nm工艺制造,并计划2025年发布。

小结:

微软给AI PC划了一条NPU算力的“红线”,基于微软强大的生态号召力,AI PC处理器厂商都十分重视NPU性能的提升,当然这也有利于后续AI PC上端侧AI真正的应用普及。40+ TOPS NPU也许会成为今后用户购买AI PC的一个必选项。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19245

    浏览量

    229596
  • AI
    AI
    +关注

    关注

    87

    文章

    30665

    浏览量

    268828
  • NPU
    NPU
    +关注

    关注

    2

    文章

    277

    浏览量

    18581
  • 算力
    +关注

    关注

    1

    文章

    960

    浏览量

    14784
  • AI PC
    +关注

    关注

    0

    文章

    123

    浏览量

    233
收藏 人收藏

    评论

    相关推荐

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    、GPU、NPU,给我们剖析了芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解
    发表于 10-15 22:08

    超紧凑模块提供高达 39 TOPS AI

    的 XDNA™ NPU 和强大的 Radeon RDNA 3™ 图形处理器,可为AI推理提供高达39 TOPS的惊人
    发表于 09-25 13:46 1302次阅读
     超紧凑模块提供高达 39 <b class='flag-5'>TOPS</b> <b class='flag-5'>AI</b> <b class='flag-5'>算</b><b class='flag-5'>力</b>

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    社会资源和资本力量关注芯片的发展,希望我们的国家能够更独立自主地设计制造高性能芯片。 内容简介: 本书介绍了超级计算机
    发表于 09-02 10:09

    ARMxy工业控制为视频监控提供1Tops支持

    ARMxy ARM工业控制以其1TopsNPU,在视频监控中的应用展现出了不错的性能和广泛的应用,为用户提供了高效、稳定和可靠的解决
    的头像 发表于 08-20 12:03 298次阅读
    ARMxy工业控制<b class='flag-5'>器</b>为视频监控提供1<b class='flag-5'>Tops</b><b class='flag-5'>算</b><b class='flag-5'>力</b>支持

    用ARMxy ARM工业控制自带的1Tops实现高性能图像处理

    ARMxy ARM工业控制凭借其强大的性能、灵活的配置和高度集成的特性,尤其是其内置的1TopsNPU(神经网络
    的头像 发表于 08-20 11:55 406次阅读
    用ARMxy ARM工业控制<b class='flag-5'>器</b>自带的1<b class='flag-5'>Tops</b><b class='flag-5'>算</b><b class='flag-5'>力</b>实现高性能图像<b class='flag-5'>处理</b>

    刷新AI PC NPU,AMD锐龙AI 9 HX 375领衔55 TOPS

    电子发烧友网报道(文/黄晶晶)最近AMD官网上线了锐龙AI 300系列中的最新成员锐龙AI 9 HX 375处理器。原本Ryzen AI 9 HX 370的
    的头像 发表于 08-07 00:28 3315次阅读
    刷新<b class='flag-5'>AI</b> <b class='flag-5'>PC</b> <b class='flag-5'>NPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>,AMD锐龙<b class='flag-5'>AI</b> 9 HX 375领衔55 <b class='flag-5'>TOPS</b>

    NPUAI TOPS是什么?它们有哪些性能?

    可运行AI模型的性能、准确性和效率。如今,TOPS(每秒万亿次运算)是衡量处理器AI性能的主要方式之一。TOPS是基于
    的头像 发表于 06-13 10:33 800次阅读

    Lunar Lake:NPU性能全面提升,能耗也大幅降低,综合AI提升至120TOPS

    英特尔CEO帕特·基辛格在COMPUTEX 2024上发表主题演讲,正式公布了下一代面向AI PC的移动处理器Lunar Lake,不仅CPU、GPU、NPU性能全面提升,能耗也大幅降
    的头像 发表于 06-05 15:54 8368次阅读
    Lunar Lake:<b class='flag-5'>NPU</b>性能全面提升,能耗也大幅降低,综合<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>提升至120<b class='flag-5'>TOPS</b>

    AI PC引发的NPU大战?英特尔:仅30%开发者选择NPU

    随着COMPUTEX 2024的日益临近,关于人工智能(AI)个人计算机(PC)的话题开始变得愈发热门和受关注。据微软公司近期发布的相关技术规范要求,所有运行Windows操作系统的AI PC
    的头像 发表于 06-03 17:24 853次阅读

    实测NPU“空转”,AI PC首个落地应用只调用GPU?

    电子发烧友网报道(文/梁浩斌)去年开始,整个PC产业链,自上而下地都在为AI PC造势。从处理器端的英特尔、AMD、高通等开始,到下游终端厂商,宣传上清一色的
    的头像 发表于 05-22 00:16 3155次阅读

    AI PC市场争霸:英特尔、AMD、高通芯片谁主沉浮?

    目前英特尔的Meteor Lake处理器NPU只能提供10 TOPS的性能,没有达到下一代AI PC的标准。而 Lunar Lake 的
    发表于 04-18 14:29 409次阅读

    NPU3倍,新一代酷睿Ultra Lunar Lake抢先看

    在人工智能(AI)工作负载中可以提供100+ TOPS,其中45 TOPS来自于NPU
    的头像 发表于 04-14 11:04 631次阅读

    AMD推出锐龙8000嵌入式处理器AI高达39 T

    此款CPU选用4纳米制程、AMD基于“Zen 4”架构的CPU核心以及使用RDNA 3架构GPU和XDNA架构NPU,实现高达39TOPSAI
    的头像 发表于 04-03 10:39 868次阅读

    256Tops!CSA1-N8S1684X服务

    (基于BM1684X的高服务)高AI处理器
    的头像 发表于 03-23 08:02 1603次阅读
    256<b class='flag-5'>Tops</b><b class='flag-5'>算</b><b class='flag-5'>力</b>!CSA1-N8S1684X<b class='flag-5'>算</b><b class='flag-5'>力</b>服务<b class='flag-5'>器</b>

    骁龙X Elite处理器AI生成图片性能超群,英特尔亦被超越

    高通公司称,该款处理器内置AI处理器NPU),性能达到惊人的45 TOPS(每秒万亿次运算)。视频通过实例对比英特尔酷睿 Ultra 7
    的头像 发表于 02-28 14:09 804次阅读