AI大模型需求持续激增，中国AI芯片如何？-电子发烧友网

2月21日，英伟达（Nvidia）公布截止到2024年1月28日的第四季度营收，收入达到221亿美元，比较上一季度增长22%，较去年同期增长265%。英伟达2024财年收入增长126%，达到609亿美元。

在公布强劲财报后，Nvidia周四股价飙升16%，市值增加约2770亿美元，令其总市值接近2万亿美元。击败Facebook母公司Meta Platform在今年2月早前达到的1,960亿美元，成为华尔街史上单日市值增加最多的企业。

Nvidia创始人兼首席执行官黄仁勋表示：“加速计算和生成式AI已经达到一个转折点。全球企业、行业和各个国家的需求都在激增。由于生成式AI以及整个行业从中央处理器转向英伟达制造的加速器，对英伟达GPU的需求将保持高位。”

摩根士丹利分析师Joseph Moore表示，Nvidia的表现超过预期，直到几个季度前，我们从未见过超过20亿美元的季度收入指引，但在AI激增期间，这已经成为常规。AI需求的强劲持续令人瞩目。

2022年10月和2023年10月，美国商务部工业和安全局（BIS）两次更新对中国的先进半导体和计算设备的出口管制，英伟达中国特供版GPU产品A800、H800芯片均已经于去年11月17日起在中国禁售。除此之外，AMD发布的性能最强的MI300X、MI300A、MI250X也不能卖到中国。在ChatGPT、AI大模型带动下各国算力需求激增，中国芯片厂商如何挖掘这个市场的商机？本文进行主要的分析。

阿里云平头哥

2023年的云栖大会上，阿里巴巴集团董事会主席蔡崇信阐释了阿里云的新愿景：“打造AI时代最开放的云”。他表示，随着AI大模型技术的迅速发展，智能化时代正在开启，AI将成为各行各业的新型生产力，并对算力提出更高要求。

成立于2018年的阿里平头哥，正处于云计算的拐点之上。这是一家阿里巴巴全资的半导体芯片公司，业务主体拥有端云一体全栈产品系列，涵盖数据中心芯片、IoT 芯片、处理器 IP 授权等，实现芯片端到端设计链路全覆盖。

阿里平头哥 2019 年 9 月推出了其首款高性能人工智能推理芯片──含光800，基于 12nm 制程与自研架构，整合 170 亿晶体管，性能峰值算力达 820 TOPS。在业界标准的 ResNet-50测试中，推理性能达到 78563 IPS，能效比达 500 IPS/W。

2023 年 8 月，阿里平头哥发布了首个自研 RISC-V AI 平台，支持运行 170 余个主流 AI 模型，推动 RISC-V 进入高性能 AI 应用时代。同时，平头哥宣布玄铁处理器 C920 全新升级，C920 执行 GEMM（矩阵的矩阵乘法) 计算较 Vector 方案可提速 15 倍。

11月21日，平头哥玄铁RiSC-V上新了三款处理器：首次实现AI矩阵扩展的C907、满足Vector1.0标准的C920，以及实时处理器R910，将加速推动RiSC-V在自动驾驶、人工智能、企业级SSD、网络通信等场景和领域的大规模商用落地。C920较上一代提升了最高3.9倍的AI性能，可以跑Transformer模型，适合机器学习、自动驾驶领域。

华为昇腾910系列

Nvidia在最新提交给美国证券交易所的一份档案，认定华为是AI芯片领域的主要竞争对手。Nvidia指出，与华为在AI芯片领域进行竞争，包括GPU、CPU和网络芯片。

在2018 全联接大会上，华为提出 AI 战略和全栈全场景 AI 解决方案，并发布了 2 颗全新的 AI 芯片：昇腾 910（Ascend 910）和昇腾 310（Ascend 310）。

两款 AI 芯片均基于华为自研达芬奇架构，其中 Ascend 910（用于训练）采用 7nm 制程，半精度达256TFOPs，功耗为 350W，运算密度号称超越了 NVIDIA Tesla V100 和Google TPU v3。

Nvidia在2020 年和 2022 年推出了 A100 和 H100 芯片，占据了全球 AI 芯片市场的最大份额，华为昇腾910B据称采用的是7nm制程。业界认为，华为昇腾 910B 能力已经基本做到可对标 Nvidia A100。

华为计算官网显示，基于昇腾 910（Ascend 910）和昇腾 310（Ascend 310），华为还推出了Atlas AI 计算解决方案。华为目前 Atlas 300T 产品有三个型号，分别对应升腾 910A、910B、910 Pro B，最大 300W 功耗，前两者 AI 算力均为 256 TFLOPS，而 910 Pro B 可达 280 TFLOPS（FP16）。

此前路透社的报道，国内搜索巨头百度向华为下了订单，购买昇腾910B用于AI服务器。

最新中国移动智算中心AI服务器采购大单，华为昇腾再次成为赢家。此次四家中标候选人中，河南昆仑为超聚变全资子公司，与华鲲振宇、烽火通信（控股子公司长江计算）、神州数码均为华为昇腾认证的合伙伙伴。

百度昆仑芯

百度集团执行副总裁、百度ACG(智能云事业群)总裁沈抖表示，未来所有的企业都会强依赖大模型，而且所有的产品都会基于大模型来开发。

昆仑芯1代AI芯片于2020年量产，在百度搜索引擎、小度等业务中部署数万片，是国内唯一一款经历过互联网大规模核心算法考验的云端AI芯片。昆仑芯2代AI芯片于2021年8月量产，是国内首款采用GDDR6显存的通用AI芯片，相比昆仑芯1代AI芯片性能提升2-3倍，且在通用性、易用性方面也有显著增强。

而昆仑芯2代则采用了TSMC 工艺，性能和功耗都有显著提升。

寒武纪推出思元370、590系列及加速卡

2022年，寒武纪首颗训推一体的Chiplet智能芯片思元370及系列加速卡初次亮相WAIC，思元370是寒武纪第三代云端产品，采用7nm制程工艺，最大算力高达256TOPS(INT8)，是寒武纪第二代云端推理产品思元270算力的2倍。同时，思元370芯片支持LPDDR5内存，内存带宽是思元270的3倍，可在板卡有限的功耗范围内给人工智能芯片分配更多的能源，输出更高的算力。

而寒武纪在2016年成立，专注于人工智能芯片产品的研发与技术创新，提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件，产品广泛应用于服务器厂商和产业公司。

据悉，寒武纪最新一代思元590在性能上对标英伟达A100、A800，有可能在2024年上半年量产，成为国产替代的备选之一。

近年来寒武纪陆续推出思元、玄思等芯片/加速卡产品系列。在目前AI算力建设大爆炸时期，特别是高端进口算力芯片受限下，国产替代的需求或让寒武纪公司的芯片在算力时代抢得一定的市场份额。

沐曦：推出人工智能推理GPU曦思N100和通用计算芯片曦云C500

沐曦集成电路公司于2020年在上海成立，致力于为异构计算提供安全可靠的GPU芯片及解决方案，打造全栈GPU芯片产品。

2022年，沐熙集成电路推出了曦思N100，现处于规模化量产和大规模出货状态。曦思N100是沐曦面向人工智能推理场景推出的高效能GPU产品，内置 MXN100 异构 GPGPU 处理器以及 HBM2E 显存，单卡算力达 160TOPS（INT8）和 80TFLOPS（FP16），能够提供最高 128 路编码和 96 路解码的视频处理能力，兼容 HEVC、H.264、AV1、AVS2 等多种视频格式，最高支持 8K 分辨率。

此外，沐曦首款面向人工智能训练及通用计算的旗舰产品曦云C500在2023年6月流片，这款芯片基于自研的高性能GPU IP，特别适合千亿参数AI大模型的训练和推理，能够提供构建高密度算力和云计算部署的优秀国产GPU解决方案，在2023年底实现规模量产。

小结：

分析师估计中国人工智能芯片市场价值70亿美元。目前在大模型推理方面，国内 AI 芯片910B仅能达到Nvidia公司A100的60%-70%左右，集群的模型训练难以为继。而就在2月21日，Nvidia CEO黄仁勋向媒体表示，英伟达目前正在向客户提供两款面向中国市场的新型人工智能（AI）芯片样品，以在美国采取对华芯片出口管制措施的背景下维持该公司在中国市场的地位。

此外，除了华为昇腾外，寒武纪、沐曦、天数智芯都公布过AI训练及推理芯片，但是AI芯片生态尚未有效建立，和Nvidia CUDA生态对比，还有不少短板。