全球GPU呈现“一超一强”竞争格局-电子发烧友网

AI 服务器发展迅速，GPU 环节被英伟达与 AMD 所占据。AIGC 的发展带动AI 服务器迅速增长，TrendForce 集邦咨询预计 23 年 AI 服务器出货量约 120 万台，同比+38.4%，占整体服务器出货量的比约为9%，2022~2026 年 AI 服务器出货量 CAGR 将达 22%，而 AI 芯片 2023 年出货量将成长 46%。GPU 作为数据并行处理的核心，是 AI 服务器的核心增量。

本文来自“行业专题：GPU龙头产品迭代不断，产业链各环节持续催化”，全球GPU呈现“一超一强”的竞争格局，根据 IDC 数据，2021 英伟达在企业级 GPU 市场中占比 91.4%，AMD 占比 8.5%。

目前英伟达产品 DGX GH200 已发布，互连技术强大，算力进一步升级。5月 29 日，英伟达在其发布会上，正式发布最新的 GH200 Grace Hopper 超级芯片，以及拥有 256 个 GH200 超级芯片的 NVIDIA DGX GH200 超级计算机。

GH200超级芯片内部集成了 Grace CPU 和 H100 GPU，晶体管数量达 2000 亿个。其借助 NVIDIA NVLink-C2C 芯片互连，将英伟达 Grace CPU 与英伟达 H100 TensorCore GPU 整合。与 PCIe Gen5 技术相比，其 GPU 和 CPU 之间的带宽将提高 7倍，并将互连功耗减少至 1/5 以下。同时，DGX GH200 的 AI 性能算力将达到1exaFLOPS。

英伟达产品 DGX GH200 共享内存大幅提升，突破内存瓶颈。DGX GH200系统将 256 个 GH200 超级芯片与 144TB 的共享内存进行连接，进一步提高系统协同性。与 DGX H100 相比，DGX GH200 的共享内存提升约 230 倍。凭借强大的共享内存，GH200 能够显著改善受 GPU 内存大小瓶颈影响的 AI 和 HPC 应用程序的性能。而在具有 tb 级嵌入式表的深度学习推荐模型（DLRM）、tb 级图神经网络训练模型或大型数据分析工作负载中，使用 DGX GH200 可将速度提高4到7倍。

而 AMD 在美国时间 2023 年 6 月 13 日，推出其新款 AI 芯片 MI300 系列，两款芯片分别为 MI300A 与 MI300X，分别集成 1460、1530 亿个晶体管。MI300A内含 13 个小芯片，总共集成 1460 亿个晶体管，其内部包含 24 个 Zen 4 CPU 核心、1 个 CDNA 3 图形引擎和 128GB HBM3 内存；而 MI300X 是针对大预言模型的优化版本，其内存达 192GB，内存带宽为 5.2TB/s，Infinity Fabric 带宽为896GB/s，晶体管达 1530 亿个。AMD 表示，与上代 MI 250 相比，MI300 的 AI性能和每瓦性能分别为 MI250 的 8 倍和 5 倍。

应用先进封装 Chiplet 技术与 HBM3，工艺技术驱动产品升级。在以往 CPU、GPU 设计中，AMD 常利用其先进的封装堆叠技术，集成多个小核心，从而实现整体性能的提升。根据芯智讯，MI300 由 13 个小芯片整合而成，其中其计算部分由 9 个基于台积电 5nm 工艺制程的小芯片组成，这些小芯片包括了 CPU 和 GPU内核。3D 堆叠设计极大提升了 MI 300 的性能与数据吞吐量。同时，MI300 两侧排列着 8 个合计 128GB 的 HBM3 芯片，满足其海量且高速的数据存储需求。

AI 大模型等 AIGC 产业的升级离不开算力的底层支持，使得 GPU 等大算力芯片性能持续提升，带来产业链各环节增量。以英伟达 DGX H100 为例，其在GPU、互连技术、智能网卡、内存条、硬盘等结构上均较普通服务器有较大提升，同时其 PCB 的面积需求量与性能要求亦高于普通服务器。

（1）GPU：量价齐升，产业链最大增量。一般的普通服务器仅会配备单卡或双卡，而 AI 服务器由于需要承担大量的计算，一般配置四块或以上的 GPU。且AI大模型在训练与推理时的计算量巨大，中低端的GPU无法满足其运算需求。如在英伟达 DGX H100 中，其配备 8 个 NVIDIA H100 GPU，总 GPU 显存高达640GB；每个GPU配备18个NVIDIA NVLink，GPU之间的双向带宽高达900GB/s。若以每个 NVIDIA H100 GPU 单价 4 万美元测算，DGX H100 的 GPU 价值量为32 万美元，为 AI 服务器中的最大增量。

（2）硬盘：AI 服务器 NAND 数据存储需求提升 3 倍。AI 服务器的高吞吐量及训练模型的高参数量级亦推升 NAND 数据存储需求。美光估计，AI 服务器中NAND 需求量是传统服务器的 3 倍。一台 DGX H100 中，SSD 的存储容量达 30TB。

（3）内存：AI 服务器 DRAM 数据存储需求提升 8 倍，HBM 需求快速提升。以 HBM 为主要代表的存算一体芯片能够通过 2.5D/3D 堆叠，将多个存储芯片与处理器芯片封装在一起，克服单一封装内带宽的限制、增加带宽、扩展内存容量、并减少数据存储的延迟。根据公众号全球 SSD，三星 2021 年 2 月与 AMD 合作开发 HBM-PIM，将内存和 AI 处理器合而为一，在 CPU 和 GPU 安装 HBM-PIM，显著提高服务器运算速度。2023 年开年后，三星高带宽存储器（HBM）订单快速增加。SK 海力士亦在 2021 年 10 月成功开发出 HBM3，并于 2022 年 6 月开始量产，在 2022 年第三季度向英伟达进行供货。同时，美光估计，AI 服务器中 DRAM需求量是传统服务器的 8 倍。如在一台 DGX H100 中，内存容量达 2TB。

（4）PCB：AI 服务器 PCB 明确受益 AI 算力提升。目前普通服务器需要 6-16层板和封装基板，而 AI 服务器等高端服务器主板层数则达 16 层以上，背板层数超过 20 层。且除 GPU 外，服务器中主板、电源背板、硬盘背板、网卡、Riser卡等核心部分均需使用 PCB 板进行数据传输。服务器出货量的增加将推动 PCB需求量的提升。

（5）先进封装：高制程芯片设计成本与制造成本均呈现指数型的增长趋势，Chiplet 等先进封装应运而生。随着制程的提升，芯片成本的提升呈现指数型增长。以芯片设计为例，根据 UCIE 白皮书，28nm 制程的芯片设计成本约 0.51 亿美元，但当制程提升至 5nm 时，芯片设计成本则快速升至 5.42 亿美元，成本提升近十倍，先进制程的推进速度愈加缓慢。因此在 HPC 高性能计算领域，Chiplet 的重要性持续提升。

目前，以 CoWoS 为代表的高性能计算先进封装产能紧缺，制约 GPU 产品出货。英伟达 A100、H100 GPU 均采用台积电 CoWoS 先进封装工艺。而根据科创板日报与台湾电子时报，英伟达将原定今年 Q4 的先进封装 CoWoS 产能，改为 Q2-Q4 平均分配生产，订单生产时间较原计划大大提前。目前，台积电 CoWoS封测产能供不应求，部分订单已外溢日月光、矽品与 Amkor、联电等。以 CoWoS 为代表的先进封装技术产能紧缺，已成为制约 GPU 生产的关键环节。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

amd

amd

+关注

关注
25

文章
5505

浏览量
134774
gpu

gpu

+关注

关注
28

文章
4799

浏览量
129522
AI芯片

AI芯片

+关注

关注
17

文章
1918

浏览量
35280

原文标题：全球GPU呈现“一超一强”竞争格局

文章出处：【微信号：AI_Architect，微信公众号：智能计算芯世界】欢迎添加关注！文章转载请注明出处。

MR20强抗干扰一体式IO模块的革新力量

在快速发展的工业自动化领域，每一次技术的飞跃都是对效率与稳定性的极致追求。明达技术自主研发的强抗干扰MR20一体式IO模块,以其卓越的性能、超高的集成度以及无与伦比的抗干扰能力，正逐步重塑工业控制系统的

发表于 01-02 17:31 •153次阅读

MR20<b class='flag-5'>强</b>抗干扰<b class='flag-5'>一</b>体式IO模块的革新力量

新洁能荣获2024年全球半导体企业综合竞争力百强

近日，全球半导体市场峰会在上海成功召开。会上，世界集成电路协会发布了全球半导体企业综合竞争力百强报告，新洁能成功进入该榜单，也是唯一进入该榜

发表于 12-14 15:15 •993次阅读

2024中国大模型，一超多强格局依旧

AI之路，在于技术扎实，价值显著

发表于 12-05 11:18 •2552次阅读

2024中国大模型，<b class='flag-5'>一超</b>多<b class='flag-5'>强</b><b class='flag-5'>格局</b>依旧

【一文看懂】大白话解释“GPU与GPU算力”

随着大模型的兴起，“GPU算力”这个词正频繁出现在人工智能、游戏、图形设计等工作场景中，什么是GPU，它与CPU的区别是什么？以及到底什么是GPU算力？本篇文章主要从以下5个角度，让您全方位了解

发表于 10-29 08:05 •1126次阅读

【<b class='flag-5'>一</b>文看懂】大白话解释“<b class='flag-5'>GPU</b>与<b class='flag-5'>GPU</b>算力”

英伟达市值跃升全球第二

近日，全球科技领域的竞争格局再度发生变动。据最新数据显示，英伟达公司的市值在周一成功超越微软，跃居全球第二大公司，仅次于苹果公司。

发表于 10-08 14:38 •374次阅读

2024年全球汽车品牌价值百强榜单（TOP100）

。榜单的发布，不仅展现了全球汽车品牌竞争格局，也体现了汽车行业的发展趋势。注：排名无先后，如有遗漏错误之处请指正，转载至网络文中观点仅供分享交流，不代表贞光科技立

发表于 07-10 17:02 •986次阅读

2024年<b class='flag-5'>全球</b>汽车品牌价值百<b class='flag-5'>强</b>榜单（TOP100）

4.晶体和振荡器行业研究及十五五规划分析报告(行业竞争格局)

晶体和振荡器行业研究及十五五规划分析报告(行业竞争格局)4.1全球市场竞争格局及占有率分析4.1.1全球市场主要厂商晶体和振荡器销量（201

发表于 06-24 10:40 •505次阅读

4.晶体和振荡器行业研究及十五五规划分析报告(行业<b class='flag-5'>竞争</b><b class='flag-5'>格局</b>)

三星电子进军GPU领域,与NVIDIA展开正面竞争

在科技行业的风起云涌中，三星电子再次展现了其敏锐的市场洞察力和前瞻性的战略眼光。近日，据韩国媒体消息，三星电子在其管理委员会会议上做出了一个令人瞩目的决定——进军图形处理单元（GPU）领域，这一举措无疑将对现有的

发表于 06-19 15:29 •675次阅读

全球可穿戴腕带设备一季度出货量4120万台

Canalys最新研报显示，2024年第一季度全球可穿戴腕带设备市场保持稳定，出货量达到4120万台，与去年同期基本持平。在这一竞争激烈的市场中，各大厂商纷纷亮出成绩单，

发表于 06-06 10:15 •846次阅读

2024年最新全球EMS代工厂50强（TOP 50）

服务。随着全球电子市场的快速发展，EMS代工厂的竞争也日趋激烈。2024年最新全球EMS代工厂50强（TOP50）榜单的发布，无疑为全球电子

发表于 04-24 16:56 •9883次阅读

2024年最新<b class='flag-5'>全球</b>EMS代工厂50<b class='flag-5'>强</b>（TOP 50）

“百模大战”竞争格局报告发布，云天天书大模型入选典型案例

3月24日，在2024全球开发者大会“百模大战”商业发展讲坛上,亿欧智库正式发布《2024中国“百模大战”竞争格局分析报告》，从当前行业“百模大战”的现状入手,深入分析了当前大模型市场格局

发表于 03-26 14:01 •613次阅读

一文详解GPU硬件与CUDA开发工具

CPU 和 GPU 的显著区别是：一个典型的 CPU 拥有少数几个快速的计算核心，而一个典型的 GPU 拥有几百到几千个不那么快速的计算核心。

发表于 03-21 10:15 •1420次阅读

2月国内动力电池企业竞争格局的“微变”开始显露端倪

本周，随着2月动力电池产销数据的公布，国内电池企业竞争格局的“微变”开始显露端倪。

发表于 03-17 09:45 •1046次阅读

IDC：全球智能手机产业维持平缓增长，竞争格局变化不大

鉴于当前国际政治经济形势尚未有显著改善，以及供应链各方面的谨慎态度，预计未来全球智能手机行业将继续稳健增长，保持现有竞争格局。

发表于 03-06 09:37 •624次阅读

线路板行业的上下游竞争格局：谁是行业的领导者和后来者？

线路板行业的上下游竞争格局：谁是行业的领导者和后来者？

发表于 03-01 10:54 •1153次阅读

搜索历史

全球GPU呈现“一超一强”竞争格局

评论