0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

将大模型装进PC和手机,需要怎样的底层创“芯”?

脑极体 来源:脑极体 作者:脑极体 2024-08-07 18:02 次阅读

wKgZomazRk6Af-QIAAg0ImdzpKo536.jpg

当前,以生成式AI为代表的新一代人工智能技术持续火热,大模型推理场景向端侧加速迁移,在深度变革人机交互界面的同时,也为手机、PC等消费电子产业注入源源动能。然而,生成式AI对硬件的快速赋能背后,也对算力、存储等方面提出了新的需求。这些新的需求,也为芯片厂商、终端厂商以及应用开发者带来了新的挑战与新的机遇。

我们应该如何应对这些挑战?如何把握生成式AI带来的机遇呢?产业各界已经联手给出了答案。

近日,国内领先的通用计算CPU设计公司此芯科技正式推出了其首款专为AI PC打造的异构高能效芯片产品——“此芯P1”。据了解,这款芯片不仅异构集成了Armv9 CPU核心与Arm Immortalis GPU,还搭载了安谋科技“周易”NPU等自研业务产品,能够提供高效能的异构算力资源、系统级的安全保障以及技术生态支持,将更好地满足生成式AI在PC等端侧场景的应用需求。

wKgaomazRk-AK9TMAAerpt6lK4U639.jpg

除AI PC以外,AI手机同样热度高涨,三星、华为、小米、vivo、OPPO、荣耀等各大手机厂商也都在积极探索与端侧AI的深度融合,力求为用户带来更加智能化的新体验。

如此看来,推动端侧AI快速落地,需要更多类似的创新应用方案,而其中的底层技术革新更是关键所在。

wKgaomazRk-AfMqlAAGwOKBAQRQ699.jpg

众所周知,AI大模型从生产到应用主要包括“训练”“推理”两个步骤。其训练和推理过程需要占用大量的计算资源和存储空间,通常部署在云计算平台上。而当用户调用智能对话助手等AI大模型时,必须联网接入。但云端大模型不仅算力成本高昂,而且在实时性、数据隐私安全等方面也面临着诸多挑战。

在此背景下,端侧大模型顺势而生。其核心是将AI大模型直接部署到终端设备,让这些设备拥有“本地智能”,无需依赖网络连接,即可自行完成数据处理和智能决策。

在新一轮端侧大模型热潮中,以下两大趋势正逐步显现:

首先是大模型逐渐小型化,通过将大模型的参数规模进行有效压缩,以适配终端设备的软硬件性能范围。目前,大模型厂商新品往往包含大、中、小等不同参数量级,其最小的模型参数多在百亿以下。这背后的原因主要是出于对计算成本、功耗和性能等因素的综合考量,尤其是在端侧部署大模型时,百亿参数级大模型能够更好地匹配现阶段的大众级终端设备。

第二个趋势是终端厂商正加速端侧大模型“装机”。以PC和手机为例,自去年以来,头部PC厂商相继推出了内置本地大模型的AI PC新品,国内主流手机厂商也已经在其旗舰产品中成功部署70亿参数规模的大模型,AI PC和AI手机随即进入了应用爆发期。除此之外,端侧大模型也已扩展到智能汽车以及具身智能机器人、AR/VRIoT设备领域。

综上所述,模型公司与终端硬件公司正相向而行,共同推动端侧大模型的场景化落地,让更多普通消费者也能轻松享用到大模型带来的智能体验。而大模型与终端产品二者间的交汇点,正是边缘端设备的计算基础——芯片。

其中,CPU作为最为核心的计算“大脑”,在端侧推理过程中发挥着不容小觑的作用。

wKgaomazRlCAedjXAAGK31kNxLY397.jpg

CPU作为智能终端的运算及控制中枢,其性能直接关系到端侧设备的响应速度、处理能力、能效、用户体验和安全性等,是衡量终端性能的关键指标。生成式AI兴起后,随着大模型小型化和推理任务向端侧迁移,CPU始终稳居终端硬件的核心地位,能够出色胜任本地AI推理,为海量设备提供强有力的计算支持。具体来看:

首先,AI处理始于CPU。早期智能手机上的AI功能大多基于自然语言处理(NLP)和计算机视觉(CV)等技术,如文字转写、人脸识别、相册分类、美颜滤镜等细分功能。此类AI工作负载或是全权交由CPU处理,或是结合其他协处理器共同支持。

其次,AI处理爆发于CPU。CPU的通用性使其能够快速响应端侧大模型在不同场景的落地需求。例如面对入门级智能手机、汽车智能座舱、AIoT设备等应用场景,CPU可高效处理参数规模在数十亿级别的小型计算任务。而在PC和旗舰智能手机等更高阶的应用场景,所需处理的计算任务则相对复杂且庞大,即便配备了AI专用加速器,CPU依旧是不可或缺的计算基石,且能独立承担处理百亿参数级别的更大规模计算任务。

Arm CPU凭借其在低功耗、高能效上的显著优势,被广泛应用于各类消费电子设备。得益于Arm CPU的AI计算能力,目前全世界约99%的智能手机都具备在端侧处理大模型所需的技术,包括NEON扩展架构、SVE可扩展向量扩展技术、SME可扩展矩阵扩展技术等关键Arm架构功能。以当今的安卓平台来看,第三方应用中有70%的AI运行在Arm CPU上。除手机外,基于Arm CPU的PC市场规模也在迅速增长。

面向下一代AI终端设备,全新Arm终端计算子系统(CSS)应运而生,这是迄今为止运行速度最快的Arm计算平台,不仅在计算和图形性能上实现30%以上的提升,而且AI推理速度提高了59%,适用于更广泛的AI、机器学习(ML)和计算视觉工作负载。同步推出的还有Arm Kleidi软件开发平台,能够帮助开发者快速获得开发生成式AI应用所需的性能、工具和软件库。

wKgZomazRlGAWSq6AAKbI0Em6JA486.jpg

Arm终端CSS和Arm KleidiAI等新一代终端计算技术将进一步加速AI终端普及。预计2025年底,基于Arm架构的AI设备有望突破1000亿台。

wKgaomazRlGATPwEAAH65IwQDVI274.jpg

与此同时,随着端侧推理需求的日渐高涨,生成式AI用例将在更多元化的应用场景中“遍地开花”,然而计算任务复杂度和数据量也随之激增,将对未来AI终端硬件提出更高的要求。由此,兼具通用性和专用性的异构计算解决方案已是大势所趋,它能够有机融合CPU、GPU、NPU等不同处理器,以满足端侧大模型部署的多样化计算需求。

wKgZomazRlKAdymgAADvFoAAwyY775.jpg

其中,NPU全称Neural Processing Unit(神经网络处理单元),专门针对神经网络进行设计与优化,能更加高效地运行Transformer架构的AI模型。随着AI手机、AI PC概念的普及,NPU的重要性也日益凸显,它可以在视频、图像、系统管理等各类场景中发挥出色的AI加速能力,解决日益增长的终端推理需求。

安谋科技早在成立之初既已布局AI赛道,本土自研的“周易”NPU目前已迭代了Z系列和X系列的多款产品,广泛应用于中高端安防、智能家居、移动设备、物联网、智能座舱、ADAS、边缘服务器等市场。

开篇提到的“此芯P1”则采用了基于第三代“周易”架构设计的NPU。通过对低功耗与高算力的针对性优化,“周易”NPU不仅能够胜任长时间、高负载的任务处理,还支持多核多Cluster的算力扩展。在“周易”NPU的设计上,安谋科技从性能、精度、带宽、调度管理、算子支持等多个维度,对各类图像、视频AI模型算法进行了深度优化,并且完成了对主流大模型的适配,进一步强化其在面对高性能AI计算需求时的表现。

面对端侧生成式AI的高速发展和算力需求的不断攀升,CPU无疑是为终端设备提供了得以接入AI功能的广泛计算基础,而异构计算与NPU则为多模态大模型等新兴AI应用在端侧落地打开了新的想象空间。但无论设备和应用如何演进,算力始终是支撑端侧AI发展的基石,也是引领终端AI创新的核心引擎。

wKgaomazRlOAfJ2lAAGyBe5XPKo739.jpg

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10677

    浏览量

    209058
  • AI
    AI
    +关注

    关注

    87

    文章

    28723

    浏览量

    265992
  • NPU
    NPU
    +关注

    关注

    2

    文章

    247

    浏览量

    18358
  • 大模型
    +关注

    关注

    2

    文章

    2098

    浏览量

    1903
收藏 人收藏

    评论

    相关推荐

    ***新突破!PC新品全发布,助力英特尔PC产业生态

    海科技为何进入PC赛道?其PC业务战略是什么?这次发布的新品在性能和应用领域有哪些突破?海科技和英特尔PC生态如何实现在
    的头像 发表于 11-29 18:14 1888次阅读
    ***新突破!<b class='flag-5'>芯</b>海<b class='flag-5'>PC</b>新品全<b class='flag-5'>芯</b>发布,助力英特尔<b class='flag-5'>PC</b>产业生态

    怎样matlab中的数学模型封装成物理电气模型

    各位朋友,本人现在正在搭建双馈异步电机的内部模型,但是要和外部的电气模型连接起来,不知道怎样把数学模型封装成电气模型啊,在MATLAB中,有
    发表于 12-13 21:37

    在PCB中怎样快捷地器件从顶层移到底层

    在PCB中怎样快捷地器件从顶层移到底层,我想移很多元件,目前只会右键点元件,然后在选择bottomlayer,这种方法只适合单个元件,我想移很多元件,有没有更好的方法?
    发表于 11-19 10:31

    上海:PC底层驱动工程师

    一家新成立的高科技公司,招聘PC底层驱动工程师1名。公司位于上海市宝山区长江南路,长江软件园,邻近地铁3号线长江南路站。公司提供有竞争力的待遇。有意者请发简历到
    发表于 03-03 22:26

    Android手机操控ARM开发板外围硬件设备【科之龙】(2016年最给力!原创)

    Android手机操控ARM开发板外围硬件设备【科之龙】 (2016年最给力!原创文档)Aiku致力于打造一个真正从实战开发和实用性非常强的教程。 手把手教你android智能手机零死角远程操控
    发表于 01-12 22:23

    `融城,一个聚集各大品牌电子元器件的网站,欢迎广大行业精英来了解我们的平台!`
    发表于 08-19 10:04

    ` 本帖最后由 leilei12345 于 2016-8-23 13:43 编辑 融城`
    发表于 08-23 13:32

    齐齐PC版还是移动版好用一点

    齐齐我已经用了一段时间了,BOM表的处理我在电脑端每天需要处理大量的,PC端的我一直在用,移动端的话使用比较少,因为手机上处理表格不太方便,不过试用过一次
    发表于 05-31 15:18

    怎样才能得到LTC6090的PSpice模型?如何模型从LTspice导出到PSpice?

    请问:怎样才能得到LTC6090的PSpice模型?或者如何模型从LTspice导出到PSpice?
    发表于 11-16 07:43

    怎样把立的PCB转成allegro的

    怎样把立的PCB转成allegro的
    的头像 发表于 04-03 10:02 5871次阅读
    <b class='flag-5'>怎样</b>把立<b class='flag-5'>创</b>的PCB转成allegro的

    以MINIPC为中心,与时代同行

    2013年,INTEL推出了第一台NUC,同年在深圳成立。2023年7月,INTEL宣布停止对NUC(Next Unit of Compute,下一代计算单元)迷你电脑业务的直接投资。
    的头像 发表于 07-24 13:09 506次阅读
    以MINIPC为中心,<b class='flag-5'>创</b>盈<b class='flag-5'>芯</b>与时代同行

    Intel放弃NUC,不如看看

    在百度输入MINI PC,或者查看NUC相关的软文的时候。一家深耕pc行业10年的高新技术企业-出现在我们的眼前,他就是NUC的选择之一。
    的头像 发表于 07-24 13:07 534次阅读
    Intel放弃NUC,不如看看<b class='flag-5'>创</b>盈<b class='flag-5'>芯</b>

    海科技2023PC新品全发布 四颗EC新品重磅首发

    2023年度海科技PC新品发布会日前在深圳英特尔大湾区科技创新中心隆重举行。活动以“赋能 共建生态”为主题,此次活动全面展示了海科技
    的头像 发表于 11-30 12:05 758次阅读

    AI电脑大潮来了!AI迷你主机F1A正式面世

    什么是AI Mini PC F1A AI迷你主机怎么样?简单来说,AI Mini PC就是加入AI功能的迷你电脑。
    的头像 发表于 12-21 16:38 494次阅读
    AI电脑大潮来了!<b class='flag-5'>创</b>盈<b class='flag-5'>芯</b>AI迷你主机F1A正式面世

    我们需要怎样的大模型

    AI时代,我们需要怎样的大模型?这个问题尽管我们无法给出一个确定的答案,但显而易见的是,用户的选择正逐渐汇聚成一股趋势。6月28日,在WAVESUMMIT深度学习开发者大会上,百度公布了文心一言
    的头像 发表于 07-03 08:05 112次阅读
    我们<b class='flag-5'>需要</b><b class='flag-5'>怎样</b>的大<b class='flag-5'>模型</b>?