ChatGPT AI兴起，芯片、服务器、智能算力浪潮来袭-电子发烧友网

AI 需要多元异构算力提供支持，拉动 AI 芯片需求。人工智能算法需要从海量的图像、语音、视频等非结构化数据中挖掘信息。从大模型的训练、场景化的微调以及推理应用场景，都需要算力支撑。而以 CPU 为主的通用计算能力已经无法满足多场景的 AI 需求。以 CPU+AI 芯片（GPU、FPGA、ASIC）提供的异构算力，并行计算能力优越、具有高互联带宽，可以支持 AI 计算效力实现最大化，成为智能计算的主流解决方案。

服务器中的 CPU 和 AI 卡的数量并不固定，会根据客户应用需求调整，对于 AI 服务器来讲，较为常见的是配备 2 个 CPU，以及八个 AI 卡。而相比于 AI 服务器，传统的通用服务器则以 CPU 为主。因此，AI 的发展将极大拉动 GPGPU、TPU、NPU 等 AI 芯片的需求。

AI 计算需要多元异构算力提供支持，将极大拉动GPGPU、AISC 等 AI 芯片的需求。中国 AI 芯片市场规模有望快速增长，据艾瑞咨询发布的《2022 年中国人工智能产业研究报告(Ⅴ)》，预计 2027 年达到 2164 亿元。

中国 AI 芯片市场将保持高速增长，AI 推理芯片份额有望持续提升，国产化 AI 芯片占比有望提升。2022 年，中国的 AI 芯片市场规模约 385 亿元。随着 AI 发展以及智算中心建设浪潮，该市场预计将保持高增长趋势。据艾瑞咨询测算，到 2027 年，中国的 AI 芯片市场规模预计将达到 2164 亿元。另外，在我国高性能及 AI 服务器中， GPGPU 凭借其优秀的性能和通用能力占比 92%, 剩下份额由 AISC 和 FPGA 分享。随着 AI 模型的优化落地，AI 推理芯片的占比将日益提升。据艾瑞咨询，2022 年，中国 AI 训练芯片以及 AI 推理芯片的占比分别为 47.2%和 52.8%。

AI 芯片领域的三类玩家。大模型的训练需要大规模的训练数据以及强大的计算资源，需要多卡多机协同完成。这对 AI 芯片本身的性能，以及多卡多机的互联提出了很高的要求。目前，在 AI 芯片领域，有三类玩家。一种是以 Nvidia、AMD 为代表的实力强劲的老牌芯片巨头，这些企业积累了丰富的经验，产品性能突出。

另一种是以 Google、百度、华为为代表的云计算巨头，这些企业纷纷布局通用大模型，并自己开发了 AI 芯片、深度学习平台等支持大模型发展。如 google 的TensorFlow 以及 TPU，华为的鲲鹏昇腾、CANN 及 Mindsp ore。

最后是一些小而美的 AI 芯片独角兽，如寒武纪、壁仞等。

英伟达占据 80%以上中国加速卡市场份额，国产 AI 芯片亟待发展。根据 IDC 的数据显示，2021年中国加速卡的出货数量已经超过 80 万片，其中 Nvidia 占据了超过 80%的市场份额。剩下的份额有 AMD、百度、寒武纪、燧原科技、新华三、华为、Intel 和赛灵思等品牌。

1、英伟达：全球 GPU 龙头

英伟达占据芯片市场绝对优势。长期以来，英伟达在高端GPU市场占据绝对主导地位，现如今已量产的主流 A100 芯片相比前代产品 V100，性能得到显著提高，代表当今高端芯片水平。最新一代 H100 芯片也已经亮相，即将量产。天数智芯数据显示，2021 年英伟达在中国云端 AI 训练芯片市场的份额达到 90%。据 IDC，在 2021 年中国出货的 80 多万张加速卡中，英伟达占据超过 80%份额。芯片的研发周期较长，英伟达具有绝对先行优势，虽然目前国内企业突破英伟达垄断仍然任重道远，但寒武纪、华为 AI 芯片快速发展，有望逐步进行国产替代。

受制裁影响，英伟达对部分产品性能进行 “阉割”，推出“中国版芯片”A800、H800。2022 年10 月，美国发布了针对中国的先进计算与半导体产品的出口管制，限制美国企业向中国出口先进高端芯片设备。在新管制的限制下，英伟达的 A100、H100 被禁止售卖给中国，而采用 12nm 工艺、性能较低的 V100 GPU 芯片不在管控之列。针对此次制裁，英伟达对 A100 的部分性能进行“阉割”，推出 A800。

相比于 A100，A800 在单卡计算性能上没有差别，但是互联带宽从600GB/s 下降到了 400GB/s，在一定程度上影响了如大模型训练等多卡互联场景的性能。目前，A800 已实现量产，并在中国规模化落地应用。英伟达还推出了旗舰芯片 H100 的替代版 H800，目前还未量产。

2、海光信息：国产高性能 CPU 和 GPGPU 领军企业

海光信息专注于研发、设计和销售高端处理器（CPU 以及 GPGPU），持续技术创新、产品迭代。海光信息的主要产品为应用于服务器和工作站等设备中的通用处理器（CPU）和协处理器（DCU,即 GPGPU）。海光处理器性能出众，同时软硬件生态丰富、工具链完整、应用迁移成本低。另外，海光 CPU 与 DCU 虽脱胎于 AMD，但经过多年独立自主研发迭代，已经实现自主可控、安全可靠，是***之光。目前，苏州昆山、成都等多地超算中心已经搭载海光 CPU 与 DCU，为社会提供优质算力。

海光 CPU 一、二代均已商业化，三代初亮相，四代有序研发中。海光 DCU 一代已商业化应用，二代研发中。公司持续技术创新和演进，坚持走“销售一代，验证一代，研发一代”的产品开发策略。公司建立了完善的高端处理器的研发环境和流程，持续开发多代产品，产品性能不断提高，同时功能不断完善丰富。海光 CPU 的四代产品中，海光一号和海光二号均实现了商业化应用，海光三号已亮相发布会，海光四号处于研发阶段。海光 DCU 于 2018 年启动 DCU 第一代产品深算一号的产品研发，于 2020 年 1 月启动了深算二号的研发，截至 2022 年 6 月，深算一号已实现商业化应用。

海光 DCU 某些硬件性能与英伟达的 A100、AMD 的 MI100 相近。海光 DCU 双精度计算能力突出。据北京大学高性能计算系统中标公告（HCZB-2021-ZB0364），海光信息的 DCU Z100 的通用计算核心达到 8192 个。其关键性能指标实现：FP64 10.8TFlops，显存 32GB HBM2，对比全球芯片巨头的高端 AI 芯片不遑多让。英伟达 A100 的相关指标为：FP64 9.7 TFlops、显存40/80GB HBM2。AMD MI100 的相关指标为：FP64 11.5 TFlops、显存 32GB HBM2。

海光 DCU 生态丰富，工具链完整。海光的 DCU 脱胎于 AMD，兼容主流生态——开源 ROCmGPU 计算生态，支持 TensorFlow、Pytorch 和 PaddlePaddle 等主流深度学习框架、适配主流应软件。ROCm 又被称为类 CUDA，现有 CUDA 上运行的应用可以低成本迁移到基于 ROCm 的海光平台上运行。

2022 年，海光发布国内首个全精度（FP64）异构计算平台，该平台搭载 CPU 海光三号和 DCU海光深算，涵盖数值模拟、AI 训练、AI 推理所需的多样算力，实现了智能计算与数值运算的深度融合。同时，此平台可全面支持 TensorFlow、PyTorch、Caffe2 等主流 AI 深度学习框架，目前已超过 1000 种应用软件部署在该平台上。

3、寒武纪：国产 AI 芯片先行者

寒武纪始终深耕芯片研发，不断推陈出新、实现技术进步。寒武纪成立于 2016 年，专注人工智能芯片产品的研发与创新。公司成立之初便开始了对 AI 芯片领域的探索创新。并在 2016 年年底成功研发出全球首款 AI 手机芯片——寒武纪 1A 。2017 年，这款芯片被搭载于华为的高端系统级芯片麒麟 970，应用于 Mate10 手机，并获得了广泛好评。芯片可以在功耗极低的前提下，涵盖人脸识别、语音识别、图像增强等多种功能。此后，寒武纪又陆续推出了多款 AI 芯片产品，包括云端训练芯片 MLU100、边缘推理芯片 MLU270、车载推理芯片 MLU290 等。这些产品都具有高性能、低功耗、高集成度等特点，在图像识别、语音识别、自然语言处理等领域都有着优异的表现。

思元 370 是寒武纪的首款训练推理一体芯片，也是其云端产品的第三代。思元 370 采用了 7nm 制程工艺，并成为首款采用 Chiplet 技术的人工智能芯片。该芯片最大算力可达 256TOPS(INT8)，是上一代云端推理产品思元 270 算力的两倍，同时该芯片还支持 LPDDR5 内存，内存带宽是 270的三倍，因此可以在板卡有限的功耗范围内为人工智能芯片分配更多的能源，从而输出更高的算力。思元 370 智能芯片还采用了先进的 Chiplet 技术，支持灵活的芯粒组合，仅用单次流片便可以实现多款智能加速卡产品的商用。目前，该公司已推出三款加速卡：MLU370-S4、MLU370-X4和 MLU370-X8，包含应用于计算密度高的数据中心、针对专注人工智能推理相关业务的互联网厂商需求和应用于对算力带宽要求高的训练任务，满足用户的多样化需求。

新一代训练芯片寒武纪 590 还未量产，据悉训练能力突出。寒武纪最新一代云端智能训练芯片思元 590 还未正式发布，据寒武纪董事长在 2022 WAIC 上介绍，思元 590 采用全新的 MLUarch05架构，实测训练性能较在售产品有了显著提升。思元 590 可提供更大的内存容量和更高的内存带宽，其 PCIe 接口也较上代实现了升级。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
455

文章
50809

浏览量
423525
算法

算法

+关注

关注
23

文章
4612

浏览量
92881
人工智能

人工智能

+关注

关注
1791

文章
47274

浏览量
238450

原文标题：ChatGPT AI兴起，芯片、服务器、智能算力浪潮来袭

文章出处：【微信号：AI_Architect，微信公众号：智能计算芯世界】欢迎添加关注！文章转载请注明出处。

算力再跃升！亿万克发布新一代AI服务器——G882N7+！

的特质，但算力告急。想要打破数智时代的算力瓶颈，异构智算成为有效方案。近期，亿万克面向激增的AI

发表于 10-25 17:02 •212次阅读

什么是AI服务器？AI服务器的优势是什么？

AI服务器是一种专门为人工智能应用设计的服务器，它采用异构形式的硬件架构，通常搭载GPU、FPGA、ASIC等加速芯片，利用CPU与加速

发表于 09-21 11:43 •851次阅读

算力服务器为什么选择GPU

随着人工智能技术的快速普及，算力需求日益增长。智算中心的服务器作为支撑大规模数据处理和计算的核心设备，其性能优化显得尤为关键。而GPU

发表于 07-25 08:28 •626次阅读

AI高算力服务器散热，需要用到哪些导热界面材料？

在数字经济、AI大模型等发展的带动下，全球服务器的市场需求急剧提升，利用其强大的计算能力，能够处理复杂的算法和海量数据。与此同时，生成式人工智能的大算

发表于 05-30 10:44 •670次阅读

智能算力存在缺口，AI服务器市场规模持续提升

商的资本支出将大幅增加。全球前四大云服务商资本支出调升，预计将从2023年的1400亿美元提升至2024年的超过2000亿美元。 AI 服务器市场规模持续增长近些年，人工智能

发表于 05-22 00:14 •3089次阅读

解锁未来，华为云耀云服务器 X 实例引领柔性算力新时代

在数字化浪潮的推动下，云计算已经成为企业发展的必然选择，但传统云服务器常常束缚了企业的发展步伐。云耀云服务器 X 实例的问世，标志着云计算迈向了全新的柔性算

发表于 04-11 22:23 •1020次阅读

256Tops算力！CSA1-N8S1684X算力服务器

（基于BM1684X的高算力服务器）高算力AI处理器

发表于 03-23 08:02 •1637次阅读

联想向燧弘华创交付首台搭载国产AI算力芯片的问天WA5480 G3服务器

3月19日，在联想集团(全球)最大的智能计算设备研发和制造基地——联宝科技，联想集团向燧弘华创交付联想首台可搭载国产AI算力芯片的联想问天W

发表于 03-22 09:40 •873次阅读

联想首台可搭载国产AI算力芯片的联想问天WA5480 G3服务器成功交付

3月19日，在联想（全球）最大的智能计算设备研发和制造基地——联宝科技，中国领先的智能IT基础设施提供商联想续写智算新篇章：联想首台可搭载国产AI算

发表于 03-20 10:36 •518次阅读

联想首台搭载国产AI算力芯片服务器成功交付

在联想（全球）最大的智能计算设备研发和制造基地——联宝科技，一场科技界的盛事吸引了业界的广泛关注。这一天，中国领先的智能IT基础设施提供商联想成功交付了首台可搭载国产AI算

发表于 03-20 09:42 •763次阅读

【算能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

通过网络可以了解到，算能RADXA微服务器的具体规格：处理器：BM1684X 算力：高达32Tops INT8峰值

发表于 02-28 11:21

国产服务器主阵地有哪些？

AI 算力、低功耗等对服务器算力芯片提出新的要求，英

发表于 01-29 11:29 •1264次阅读

卫星通信序幕拉开，AI算力浪潮澎湃

AI浪潮催生算力要求，基础设施需求持续提升。AIGC带来的超大算力需求拉动通信基础设施建设及扩容

发表于 01-03 10:22 •392次阅读

AI算力应用中的光模块产品

以ChatGPT为代表的AI大模型应用普及将推动算力需求快速增长，服务器产业链是其中重要的受益环节之一，

发表于 01-02 15:32 •551次阅读

认识一下AI算力应用中的光模块产品

以ChatGPT为代表的AI大模型应用普及将推动算力需求快速增长，服务器产业链是其中重要的受益环节之一，

发表于 12-29 16:14 •961次阅读