大模型时代，AI芯片面临的三大挑战

2023年，大模型的突破和生成式AI的兴起，正在引领AI产业迈入智能创新的新阶段，同时也将引发算力架构的新变局。

根据最新发布的《2023-2024年中国人工智能计算力发展评估报告》，全球人工智能硬件市场（服务器）规模将从2022年的195亿美元增长到2026年的347亿美元，五年年复合增长率达17.3%；在中国，预计2023年中国人工智能服务器市场规模将达到91亿美元，同比增长82.5%，2027年将达到134 亿美元，五年年复合增长率达21.8%。中国算力市场、特别是智算领域，正在蓬勃发展。

01. CPU+GPU成为AI异构计算主要方式

大模型时代，构建和调优生成式AI基础模型以满足应用需求，将为整个基础设施市场带来改变和发展机遇。“以应用为导向、系统为核心”，将是未来算力升级的主要路径。

从技术发展视角来看，异构计算仍然是芯片发展趋势之一。在单一系统中，异构计算通过利用不同类型的处理器（如CPU、GPU、ASIC、FPGA、NPU等）协同工作，执行特定任务，以优化性能和效率，更高效地利用不同类型的计算资源，满足不同的计算需求。比如，通过发挥GPU并行处理能力，可以提高模型，尤其是大模型的训练速度和效率；在数据预处理、模型调优等阶段，可以使用CPU进行计算和决策，或在控制和协调计算资源(如GPU、FPGA等) 的工作过程中使用CPU，以确保计算过程的顺利进行；此外，可通过使用FPGA进行推理加速，从而将模型实现在边缘设备的部署，以开展更快速的实时推理工作。

IDC调查研究显示，截至2023年10月，中国市场普遍认为“CPU+GPU”的异构方式是AI异构计算的主要组合形式。

图：人工智能训练和推理工作负载选用的计算架构

（来源：《2023-2024年中国人工智能计算力发展评估报告》）

02. 大模型时代，AI芯片三大挑战

AI算力需求的提升给中国本土芯片厂商的发展提供了较大的空间，带来新的机遇。IDC预计，2023年中国人工智能芯片出货量将达到133.5万片，同比增长 22.5%。

在面临广阔机会的同时，大模型时代，我国AI芯片也面临着新的发展挑战。

首先，与国际领先AI芯片差距较大，以英伟达最新发布的H200 GPU为例，性能已经达到其A100 GPU近5倍。而我国AI芯片的大模型集群训练性能，只有个别接近A100/A800，大多数不到其性能的50%，这也意味着，我国AI芯片在大模型训练性能方面，与国际领先水平约是3年的代际差距。

其次，生态方面，英伟达的CUDA经过17年、累计超过100亿美元的资金投入，全球开发者已经超过300万，成为全球AI开发处于垄断地位的基础库。反观国内AI芯片企业，整体市场占有率加起来不超过10%，且各家AI芯片软件各异、生态零碎割裂。

此外，在当前时代背景下，我国AI芯片产能受阻、向高端芯片进阶关键技术受限等，也在一定程度上制约了AI芯片的发展。

03. 破解异构算力三重难题

基于当前现状，北京智源人工智能研究院副院长兼总工程师林咏华提出，大模型时代，我国异构算力主要面临三重束缚。

异构算力束缚一：不一样的算力，不能合池训练

具体而言，当前异构混合分布式训练存在如下挑战：不同架构设备的软硬件栈不兼容，数值精度也可能存在差异；不同架构设备之间很难高效通信；不同设备算力和内存不同，很难进行负载均衡切分。

这些挑战很难一次性解决，目前智源已经尝试在相同架构不同代际设备或者在兼容架构的不同设备上进行异构训练，未来将探索不同架构设备上的异构训练。FlagScale是一个支持多厂商异构算力合池训练的框架，当前实现了异构流水线并行及异构数据并行两种模式。

异构流水线并行：在该模式实际训练时，可以跟数据并行、张量并行以及序列并行进行混合来实现高效训练。根据反向传播算法内存使用特点，该模式适合将内存比较大的设备放在流水线并行靠前的阶段，内存小的设备放在流水线并行靠后的阶段，然后根据再设备的算力来分配不同的网络层来实现负载均衡。

异构数据并行模式：在该模式实际训练时，可以跟张量并行、流水线并行以及序列并行进行混合来实现大规模高效训练。算力和内存都比较大的设备将处理较大的微批次大小，而算力和内存都比较小的设备将处理较小的微批次大小，从而实现不同设备上的负载均衡。

根据智源所展示的在英伟达和天数智芯集群的三组异构混合训练实验结果，显示异构混合训练收益较好，在三种配置情况下接近甚至超过了性能上限，这说明异构混合训练的效率损耗较低，获得了较好的训练收益。

林咏华介绍，异构算力合池训练框架FlagScale正在实现英伟达算力集群与天数智芯算力集群的异构合池训练，未来将实现更多不同中国厂商算力集群之间的异构合池训练，推动不同厂商异构芯片的通信库标准化，实现高速互通互联。

她表示，在芯片的迭代更新过程中，肯定存在新、旧代际芯片混用的过程，希望继续攻关兼容异构芯片的混合训练技术，也希望在同一个数据中心，各种商业资源可以灵活组合，将性能和效率最大化。

异构算力束缚二：受CUDA制约，算子库在不同硬件上适配难度大

当前，我国AI芯片软件生态薄弱，主流AI框架以支持英伟达芯片为主。对于国产AI芯片来说，需要适配多款框架，每次AI框架版本升级，需要重复适配；同时，各AI芯片厂商有自己的底层软件栈，彼此不兼容。

在大模型需求下，上述问题带来三大影响：第一，针对大模型需要的算子及优化方法缺失，导致模型无法运行或者运行效率低；第二，会出现因为芯片架构和配套的软件实现差异而带来的精度误差问题；第三，要在国产AI芯片上实现大模型训练，需要大量移植工作，适配迁移成本很高。

对此，林咏华认为，构建公共的AI芯片开放软件生态非常关键，结合大模型研究和发展需求，基础架构层面要构建基于下一代开放、中立的AI编译器中间层，并且要适配PyTorch框架，支持开源编程语言及编译器扩展。下一步，要继续探索最大化硬件基础架构性能和利用率的共性核心技术，对典型和复杂算子的软硬件协同极限优化，使得成果开源开放，高效支撑大模型训练。

异构算力束缚三：芯片架构、软件各异，评测难度大，影响落地进展

当前，AI芯片企业众多，各自架构和开发工具链不同，且AI框架众多，再加上层出不穷的场景和复杂多变的模型，导致适配工作量大、开发复杂度高、评测标准难统一，影响了产品的落地和规模化应用。

林咏华认为，AI异构芯片的评测，对行业生态有重要价值。当前，业界缺少被广泛认可的、中立的、开源开放的、针对异构芯片的评测体系。应该建立开源的AI芯片评测项目，具体包括基础环境、异构芯片基础软件、测试集等，对模型运行的支持情况、芯片的训练时间和计算吞吐量、芯片和服务器其他零部件的使用情况、芯片对不同框架和软件生态的支持能力等方面，进行全方位评测。

04. 写在最后

AI大模型的发展提升了智能算力的需求。IDC数据显示，2022-2027年，我国智能算力规模年复合增长率达33.9%，超越同期通用算力规模16.6%的年复合增长率。

本土AI芯片厂商正面临着新的机遇和挑战。针对单芯片算力的瓶颈问题、多芯片异构合池训练难题，以全局思维打造算力基础设施平台成为未来的关键。特别是在构建与硬件匹配的软件生态，包括操作系统、中间件和工具链等方面，随着大模型从基础研发走向应用落地，软件基础设施的重要性和价值将会进一步凸显。这也是大模型在完成了“从0到1”的预训练之后，在通往“从1到100”的应用和大规模落地过程中，AI芯片作为核心基础环节必须完成的修炼，也将给中国AI芯片产业带来深远的影响。

审核编辑：黄飞

阅读全文

cpu(206166) cpu(206166)
gpu(126255) gpu(126255)
AI(263628) AI(263628)
人工智能(229987) 人工智能(229987)
大模型(810) 大模型(810)

国内AI芯片面临怎样的机遇和挑战？

了传统芯片生态的规则，垄断了国内市场，在智能化新时代，国内的AI芯片又面临怎样的机遇和挑战？AI芯片产业落地需要关注哪些问题？如今AI算法的应用越来越广泛，对AI算力提出了很高的要求，而传统处理器架构性能提升受限，那么AI芯片

2022-05-29 10:24:01

4428

中国芯片消费量占全球50%，Synopsys.ai全栈式引领EDA+AI芯片设计，赋能汽车产业腾飞

分享了他对于SysMoore时代下，芯片开发者面临的五大挑战。在挑战当前，新思科技已经率先整合了EDA和AI，并通过Synopsys.ai全栈式解决方案来引领汽车、数据中心等市场的芯片和系统创新。芯片开发者面临五大挑战 Sassine Ghazi表示，芯片开发者面临的五大挑战：软件复杂性、系统复

2023-09-18 17:16:56

1886

802.11ah是什么？802.11ah面临哪些测量挑战？

802.11ah的基本原理是什么？802.11ah面临哪些测量挑战？

2021-05-20 06:46:50

AI时代推动存储器的创新与发展

AI 时代的计算应用，了解它们如何在未来蓝图中推动创新

2021-01-19 07:48:18

AI算法中比较常用的模型都有什么？

AI算法中比较常用的模型都有什么

2022-08-27 09:19:06

HUD 2.0面临哪些挑战？如何去解决？

HUD 2.0的发展动力是什么？HUD 2.0面临哪些挑战？如何去解决？

2021-06-01 06:44:07

LED在汽车领域应用面临哪些挑战？

控制LED的方法有哪些？LED在汽车领域应用面临哪些挑战？LED主要应用于哪些领域？

2021-05-11 06:08:17

LTE测试技术面临什么挑战

运营商建设LTE网络的基本策略之一为LTE网络、2G和3G网络将长期共存，共同发展，多模、多制式、多频的融合。LTE网络测试领域也在业界的持续努力与实验网的验证下取得了很大的进步。但在多网协同的发展方向上，仍面临诸多挑战，需要进一步积极应对。

2019-06-10 07:48:45

MEMS传感器面临哪些挑战呢？如何去解决？

MEMS传感器面临哪些挑战呢？MEMS传感器面对这些挑战该如何去解决呢？

2021-07-19 06:39:01

Multicom发展趋势如何？它面临哪些挑战？

Multicom发展趋势如何？开发Multicom无线产品时需要面临哪些挑战？如何突破测试Multicom产品的难题呢？有没有一种解决方案可以既缩短测试时间又节约测试成本呢？

2021-04-15 06:26:53

RFID原理是什么？RFID技术面临哪些挑战？

2021-05-26 06:06:21

USB 2.0结构是怎样构成的？USB 2.0面临哪些测试挑战？

2021-05-10 06:30:30

WiMAX的发展与应用面临的挑战分析

和一定移动性的城域宽带无线接入技术是目前业界最为关注的宽带无线接入技术之一。本文将从WiMAX的技术发展、产业现状、与LTE，UMB和IMT-Advanced之间的关系，以及WiMAX未来应用面临的挑战等几个方面进行分析。

2019-07-16 07:28:51

为什么采用WCSP？WCSP面临的挑战有哪些？

2021-04-21 06:14:53

何谓Full HD？Full HD面临哪些技术挑战？

2021-06-07 07:14:47

使用空中鼠标系统面临哪些挑战？如何去克服这些挑战？

2021-05-10 07:26:42

制造NIST相机面临的主要挑战是什么？如何去解决？

NIST相机是由哪些部分组成的？NIST相机有什么作用？制造NIST相机面临的主要挑战是什么？如何去解决？

2021-07-09 06:58:12

基于能量采集技术的BLE传感器节点设计面临哪些挑战？

基于能量采集技术的BLE传感器节点设计面临哪些挑战？如何去应对这些挑战？

2021-05-17 06:03:02

多声道音频技术是什么？PC音频子系统面临哪些设计挑战？

2021-06-04 07:02:37

多模多频段终端面临什么挑战？

智能手机无线通信模块由芯片平台、射频前端和天线3大部分构成。LTE引入后多模终端需支持更多的频段，这将导致射频前端器件堆积。本文通过对无线通信模块各部分的一一解读，分析多模多频段终端在产品实现上所面临的挑战和对策。

2019-08-26 07:35:26

多点综合技术面临什么挑战？

随着设计复杂性增加，传统的综合方法面临越来越大的挑战。为此，Synplicity公司开发了同时适用于FPGA或 ASIC设计的多点综合技术，它集成了“自上而下”与“自下而上”综合方法的优势，能提供高结果质量和高生产率，同时削减存储器需求和运行时间。

2019-10-17 06:29:53

如何加速电信领域AI开发？

全流程工作中面临的各种困难。继机械化、电气化、信息化三次工业革命后，以人工智能为代表的第四次工业革命正在到来，驱动人类社会迈向新纪元。就在今年的全联接大会上，华为发布了AI战略与全栈全场景AI解决方案

2021-02-25 06:53:41

如何高效利用能源是物联网发展面临的最大挑战

2021-05-21 07:15:19

实现超低功耗蓝牙设计面临的主要挑战是什么？

2021-05-19 06:39:34

工业互联网面临的挑战

工业互联网面临的挑战新一代工业控制网解决方案的重要性全光纤工业传输控制网的系统架构

2021-02-22 09:17:49

并行编程模型有什么优势

并行编程模型是并行计算，尤其是并行软件的基础，也是并行硬件系统的导向，在面临多核新挑战的情况下，什么样的并行编程模型在未来能成为主流，还很难说。至少到目前，还处于百家争鸣的时代，很多模型提出，很多在应用，下面我们简单介绍一下当前的并行编程模型现状。

2019-07-11 08:03:33

患者监护仪设计面临的挑战有哪些？

远程患者监护系统面临的五大设计挑战：电池寿命便携性或尺寸患者安全安全的数据传输集成

2020-11-23 06:43:02

探讨AI芯片设计和开发的6个挑战

AI实现的特点有哪些？AI芯片设计和开发面临哪些挑战？

2021-11-02 09:19:08

无人机战国时代中国须破解三大挑战

陈虎点兵：无人机“战国时代”，中国必须破解三大挑战　　最近网络上曝出2015号歼20试验机首飞，引起军迷们的关注。歼20的研发不断取得进展，标志着在四代机国际竞争中形成了中、美、俄三国竞争时代。　　

2020-05-15 07:53:47

无线基础设施容量面临的挑战是什么？

2021-05-20 06:47:50

无线智能IP监控面临的技术挑战是什么？怎么解决？

2021-05-31 06:27:15

有什么方法可以解决HID设计面临的挑战？

HID设计面临哪些挑战？有什么方法可以解决HID设计面临的挑战？

2021-05-17 06:06:54

机器开发人员面临哪些软件挑战以及硬件挑战？如何去应对这些挑战？

2021-06-26 07:27:31

模拟电路技术在数字时代面临的挑战有哪些？

模拟技术的无可替代的优势是什么？模拟电路技术在数字时代面临的挑战有哪些？未来，模拟技术的发展趋势是什么？与过去相比，目前模拟技术最突出应用领域有哪些？TI在模拟电路领域的发展方向和发展思路是什么？

2021-04-21 07:11:20

毫微安电流测量技术面临了哪些挑战？

请问毫微安电流测量技术面临的挑战有哪些？

2021-04-09 06:27:49

汽车无线安全应用面临哪些设计挑战？

2021-05-19 06:41:47

测试高速串行总线面临哪些挑战？如何应对这些测试挑战？

高速串行总线的特点是什么？测试高速串行总线面临哪些挑战？如何应对这些测试挑战？

2021-05-10 07:00:10

电力系统设计面临什么挑战？

电力系统设计工程师们正面临着较之以往更大的挑战。更加复杂的传感算法、最新的能源效率挑战和新一代高级传感器的应用，都意味着电力设计师们需要学习比以往更加广泛的技能，同时不断吸收新的设计思想和解决方案，只有这样才能让企业在电力市场上占有一席之地。

2019-08-20 07:33:45

电动汽车无线充电面临哪些挑战？

电动汽车无线充电面临哪些挑战？有哪些问题正阻碍无线充电的普遍运用？

2021-06-26 06:44:22

电子系统设计所面临的挑战是什么

电子系统设计所面临的挑战是什么什么是高速电路？高速电路面临的问题怎么解决？

2021-04-26 06:55:11

移动电视射频技术面临什么挑战

随着数字移动电视不断向移动设备的应用转移，应用和系统工程师正面临着各种挑战，比如外形尺寸的小型化、更低的功耗以及信号完整性。对现有移动电视标准的研究重点将放在了DVB-H上。本文将从系统角度讨论DVB-H接收器设计所面临的机遇和挑战，并重点介绍射频前端。

2019-06-03 06:28:52

精确测量阻抗所面临的挑战有哪些

精确测量阻抗所面临的挑战

2021-01-27 07:34:05

自动驾驶车辆中AI面临的挑战

自动驾驶车辆中采用的AI算法自动驾驶车辆中AI面临的挑战

2021-02-22 06:39:55

请问开关管13003芯片面积的问题

请问图中字样的三极管芯片面积是多大？谢谢

2014-05-08 17:07:35

调试速度高达几个Gb每秒的连接时所面临的挑战

本文将讨论信号集成和硬件工程师在设计或调试速度高达几个Gb每秒的连接时所面临的挑战。无论是进行下一代高分辨率视频显示、医学成像、数据存储或是在最新的高速以太网和电信协议中，我们都面临相同的信号集成挑战。那就从过度均衡开始讨论。

2021-03-01 10:17:12

高速通信面临的挑战是什么？

2021-05-24 06:34:15

AI大模型可以设计电路吗?

AI大模型

电子发烧友网官方发布于 2024-01-02 15:09:29

AI大模型怎么解决芯片过剩?

AI大模型

电子发烧友网官方发布于 2024-01-02 15:42:05

群雄混战 AI芯片设计面临的挑战与趋势

随着深度学习和AI应用的不断演进，近两年AI芯片厂商不断涌现，加之贸易摩擦中芯片概念的普及，2018年的AI芯片领域持续火热。在国内，贴上AI芯片标签的公司已经超过40家，其中的佼佼者们获得不菲融资。

2019-01-07 16:48:07

4324

安防AI的发展主要面临以三个方面的挑战

安防AI的发展主要面临以三个方面的挑战：算法的场景适应能力、大规模应用的技术与经济可行性和面向业务应用的解决方案。

2019-01-30 10:45:56

504

这款芯片在计算时也能存储

AI 对算力提出了更高的要求，传统的芯片面临挑战，不过在量子计算和类脑计算获得长足发展之前，芯片算力的提升依旧依靠现有技术的提升和创新。

2019-12-11 16:07:33

2957

泛安防时代来临安防行业面临新机遇的同时也将面临新的挑战

人工智能第三次浪潮的来袭，加速推进了传统安防向智能安防的演进速度。“AI+”的出现使得安防行业的边界一步步拓宽，一个崭新的泛安防时代正在向你我走来！那泛安防时代来临，产业又将面临哪些新的机遇和挑战呢？

2019-12-18 10:26:28

645

研究人员新开发出一种能同时计算和存储的芯片

AI对算力提出了更高的要求，传统的芯片面临挑战，不过在量子计算和类脑计算获得长足发展之前，芯片算力的提升依旧依靠现有技术的提升和创新。

2020-04-24 10:29:33

480

AI在制造领域落地面临的挑战

华为在智能制造方面的经验对于中国制造升级非常有价值，在了解华为是如何实现智能制造之前，让我们先来看看AI在制造领域落地面临的挑战。

2020-09-03 09:53:31

2610

智能互联时代,算力面临哪些挑战?

据 OpenAI 公司的最新统计，OpenAI 在 2019 年计算了自 2012 年以来所有模型所用的计算量。他们发现最大规模的 AI 模型所需要的算力已经增长了 30 万倍，平均是每 3.4

2020-09-29 10:38:26

3034

什么是物联网芯片，物联网芯片面临着哪些难题

聊聊物联网芯片面临哪些难题？从中兴事件，一直到中美贸易持续升温，我国芯片行业受制于人的问题已经被大多数人悉知。因此一波造芯热潮来了，但造芯片并不是那么容易的事情，而且对于中国来说，除了手机

2020-12-07 14:54:50

2035

超分辨技术在RTC领域应用面临的机遇与挑战

本文将着眼于AI技术从研究到部署的落地问题，分享超分辨技术在RTC领域落地应用所面临的机遇与挑战。

2021-01-07 09:45:00

2791

后摩尔时代芯片设计面临挑战

随着AI、服务器、智能汽车、5G、工业智能控制等应用领域对芯片性能、功耗、成本的要求越来越分化，目前的EDA工具发展速度越来越跟不上芯片设计的规模和需求。系统公司与互联网公司对新一代设计工具的需求

2021-06-15 17:12:17

1893

国内外硅光芯片面临的挑战

无论是数据中心以及5G基建的光模块、汽车激光雷达和智能穿戴生物光电传感器，还有光量子通信等芯片的开发，都开始走向硅光这一路线。不过与传统的硅基半导体技术不同，硅光工艺依旧面临着不少挑战，尤其是为数不多的工艺平台选择。

2022-07-26 09:34:15

3625

AI大算力芯片面临的能效和成本挑战

GPU由于采用了数量众多的计算单元和超长流水线，因此更适合进行大吞吐量的AI并行计算。不过，随着大模型逐步发展，对GPU先进算力的需求在继续提升。

2023-04-10 15:06:14

837

中科驭数分享DPU在AI大模型时代下面临的机遇

中科驭数正式加入“移动云信息技术融合应用创新产业生态联合体”，创始人、CEO鄢贵海应邀在“磐石算力底座”论坛圆桌对话发言，分享DPU在AI大模型时代下面临的机遇。

2023-05-08 09:21:56

946

华为发布大模型时代AI存储新品

7月14日，华为发布大模型时代AI存储新品，为基础模型训练、行业模型训练，细分场景模型训练推理提供存储最优解，释放AI新动能。企业在开发及实施大模型应用过程中，面临四大挑战： ● 首先，数据

2023-07-14 15:20:02

475

阿里云开源AI大模型，挑战Meta、OpenAI

创新 · 挑战Meta：阿里云开源通义千问大模型 Google的RT-2：当人工智能遇上机器人在这个充满各种技术创新的时代，Google再次引领潮流，将AI与机器人技术相结合，为我们带来了一个全新

2023-08-04 18:45:01

511

芯片云上设计面临的挑战有哪些

速度是如何加快的，在云上进行芯片设计的好处有哪些，以及当今芯片云上设计面临的一些最紧迫的挑战。 SE：向芯片云上设计的转变正在加速，相应的商业模式也正在制定，工作负载也得到了更好的理

2023-08-08 10:54:44

557

当芯片变身 3D系统，3D异构集成面临哪些挑战

当芯片变身 3D 系统，3D 异构集成面临哪些挑战

2023-11-24 17:51:07

244

思尔芯如何面对大模型芯片的复杂挑战？

在大语言模型时代，急剧增长的底层算力需求和多样化的创新应用催生了芯片行业的新机遇。

2024-03-20 17:29:29

164

AI时代怎么样不被淘汰？讯飞AI鼠标助力你在AI时代成长

AI时代怎么样不被淘汰？讯飞AI鼠标助力你在AI时代成长随着人工智能的发展，AI时代已经悄然而至。在这个时代，不会使用AI技术的人将面临被淘汰的风险。而讯飞AI鼠标AM30作为一款拥有强大

2024-03-23 11:41:22

计算速度是电子芯片1000倍，光子AI芯片商用产品今年面世！

电子发烧友网报道（文/李弯弯）随着AI芯片面临算力瓶颈，用光子代替电子进行AI计算开始问世，目前已经有多家初创公司正在研究光子AI芯片，包括曦智科技、光子算数、Lightmatter、Luminous等。

2021-01-05 08:28:00

6384

大模型时代，国产AI芯片最新进展！算力集群化是必然趋势

、算力提供商也针对大模型展示了相应的方案。大模型时代，国产AI 芯片进展如何？在这次大会上，瀚博半导体、燧原科技、登临科技、天数智芯等纷纷展示了针对大模型的产品方案，呈现出国产AI芯片在大模型领域的进展情况。瀚博半导体

2023-07-11 09:05:40

1312

已全部加载完成

搜索历史

大模型时代，AI芯片面临的三大挑战

评论