全面解读英伟达AI芯片发展蓝图

　　智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会，爱诗科技创始人兼CEO王长虎，Open-Sora开发团队潞晨科技创始人尤洋，英伟达解决方案架构与工程总监王淼等50+位嘉宾已确认参会，其中，商汤科技大装置事业群解决方案总监代继，奕信通创始人张侠，趋动科技技术总监张增金等将在中国智算中心创新论坛带来主题演讲，欢迎报名。

　　真正的差异化竞争力，源于系统性地、全面地掌握整个价值链中主导无法快速复制的关键环节。

　　本文是华为2012实验室网络专家陆玉春博士去年12月在2012实验室中央研究院网络技术实验室交流平台【未来网络前沿】分享的技术文章，在华为黄大年茶思屋线上发表。文章全面复盘与回顾了英伟达网络技术，并对英伟达AI芯片路线图的未来技术推演进行了深入的分析与解读。

　　文章发布时间比北京时间3月19日发布的英伟达Blackwell系列GPU早3个多月，因此对B100的预测与实际发布新品不完全贴合。但这无碍陆玉春博士基于相关技术的分析推演与总结思考所提供的参考价值。以下是《NVIDIA AI芯片演进解读与推演》文章全文：

　　在2023年10月的投资者会议上，NVIDIA（英伟达）展示了其全新的GPU发展蓝图［1］。

　　与以往两年一次的更新节奏不同，这次的路线图将演进周期缩短至一年。预计在2024年，NVIDIA将推出H200和B100 GPU；到2025年，X100 GPU也将面世。

　　其AI芯片规划的战略核心是“One Architecture”统一架构，支持在任何地方进行模型训练和部署，无论是数据中心还是边缘设备，无论是x86架构还是Arm架构。其解决方案适用于超大规模数据中心的训练任务，也可以满足企业级用户的边缘计算需求。

　　AI芯片从两年一次的更新周期转变为一年一次的更新周期，反映了其产品开发速度的加快和对市场变化的快速响应。其AI芯片布局涵盖了训练和推理两个人工智能关键应用，训练推理融合，并侧重推理。同时支持x86和Arm两种不同硬件生态。在市场定位方面，同时面向超大规模云计算和企业级用户，以满足不同需求。

　　NVIDIA旨在通过统一的架构、广泛的硬件支持、快速的产品更新周期以及面向不同市场提供全面的差异化的AI解决方案，从而在人工智能领域保持技术和市场的领先地位。

　　NVIDIA是一个同时拥有 GPU、CPU和DPU的计算芯片和系统公司，通过NVLink、NVSwitch和NVLink C2C技术将CPU、GPU进行灵活连接组合形成统一的硬件架构，并于CUDA一起形成完整的软硬件生态。

　　在AI计算芯片架构方面，注重训练和推理功能的整合，侧重推理。围绕GPU打造Arm和x86两条技术路线。在NVIDIA的AI路线图中，并没有显示提及Grace CPU的技术路线，而是将其纳入Grace+GPU的SuperChip超级芯片路标中。

　　NVIDIA Grace CPU会跟随GPU的演进节奏并与其组合成新一代超级芯片；而其自身也可能根据市场竞争的需求组合成CPU超级芯片，实现“二打一”的差异化竞争力。

　　从需求角度来看，CPU的技术演进速度并不像GPU那样紧迫，并且CPU对于成本更加敏感。CPU只需按照“摩尔”或“系统摩尔”，以每两年性能翻倍的速度进行演进即可。而GPU算力需要不到一年就要实现性能翻倍，保持每年大约2.5倍的速率增长。这种差异催生了超级芯片和超节点的出现。

　　NVIDIA将延用SuperChip超级芯片架构，NVLink-C2C和NVLink互联技术在NVIDIA未来的AI芯片架构中将持续发挥关键作用。

　　其利用NVLink-C2C互联技术构建GH200、GB200和GX200超级芯片。更进一步，通过NVLink互联技术，两颗GH200、GB200和GX200可以背靠背连接，形成GH200NVL、GB200NVL和GX200NVL模组。NVIDIA可以通过NVLink网络组成超节点，通过InfiniBand或Ethernet网络组成更大规模的AI集群。

　　在交换芯片方面，仍然坚持InfiniBand和Ethernet两条开放路线，瞄准不同市场，前者瞄准AI Factory，后者瞄准AIGC Cloud。但其并未给出NVLink和NVSwitch自有生态的明确计划。224G代际的速度提升，可能率先NVLink和NVSwitch上落地。

　　以InfiniBand为基础的Quantum系列和以Ethernet基础的Spectrum-X系列持续升级。预计到2024年，将商用基于100G SerDes的800G接口的交换芯片；而到2025年，将迎来基于200G SerDes的1.6T接口的交换芯片。

　　其中800G对应51.2T交换容量的Spectrum-4芯片，而1.6T则对应下一代Spectrum-5，其交换容量可能高达102.4T。

　　从演进速度上看，224G代际略有提速，但从长时间周期上看，其仍然遵循着SerDes速率大约3到4年翻倍、交换芯片容量大约2年翻倍的规律。虽然有提到2024年Quantum将会升级到800G，但目前我们只能看到2021年发布的基于7nm工艺，400G接口的25.6T Quantum-2交换芯片。

　　路线图中并未包含NVSwitch 4.0和NVLink 5.0的相关计划。有预测指出NVIDIA可能会首先在NVSwitch和NVLink中应用224G SerDes技术。NVLink和NVSwitch作为NVIDIA自有生态，不会受到标准生态的掣肘，在推出时间和技术路线选择上更灵活，从而实现差异化竞争力。

　　SmartNIC 智能网卡/DPU数据处理引擎的下一跳ConnectX-8/BlueField-4目标速率为800G，与1.6T Quantum和Spectrum-X配套的SmartNIC和DPU的路标仍不明晰，NVLink5.0和NVSwitch4.0可能提前发力。

　　NVIDIA ConnectX系列SmartNIC智能网卡与InfiniBand技术相结合，可以在基于NVLink网络的超节点基础上构建更大规模的AI集群。而BlueField DPU则主要面向云数据中心场景，与Ethernet技术结合，提供更强大的网络基础设施能力。

　　相较于NVLink总线域网络，InfiniBand和Ethernet属于传统网络技术，两种网络带宽比例大约为1:9。例如，H00 GPU用于连接SmartNIC和DPU的PCIe带宽为128GB/s，考虑到PCIe到Ethernet的转换，其最大可以支持400G InfiniBand或者Ethernet接口，而NVLink双向带宽为900GB/s或者3.6Tbps，因此传统网络和总线域网络的带宽比为1比9。

　　虽然SmartNIC和DPU的速率增长需求没有总线域网络的增速快，但它们与大容量交换芯片需要保持同步的演进速度。它们也受到由IBTA（InfiniBand）和IEEE802.3（Ethernet）定义互通标准的产业生态成熟度的制约。

　　互联技术在未来的计算系统的扩展中起到至关重要的作用。NVIDIA同步布局的还有LinkX系列光电互联技术。包括传统带oDSP引擎的可插拔光互联（Pluggable Optics），线性直驱光互联LPO（Linear Pluggable Optics），传统DAC电缆、重驱动电缆（Redrived Active Copper Cable）、芯片出光（Co-Packaged Optics）等一系列光电互联技术。随着超节点和集群网络的规模不断扩大，互联技术将在未来的AI计算系统中发挥至关重要的作用，需要解决带宽、时延、功耗、可靠性、成本等一系列难题。

　　对NVIDIA而言，来自Google、Meta、AMD、Microsoft和Amazon等公司的竞争压力正在加大。这些公司在软件和硬件方面都在积极发展，试图挑战NVIDIA在该领域的主导地位，这或许是NVIDIA提出相对激进技术路线图的原因。

　　NVIDIA为了保持其市场地位和利润率，采取了一种大胆且风险重重的多管齐下的策略。他们的目标是超越传统的竞争对手如Intel和AMD，成为科技巨头，与Google、Microsoft、Amazon、Meta和Apple等公司并驾齐驱。

　　NVIDIA的计划包括推出H200、B100和“X100”GPU，以及进行每年度更新的AI GPU。此外，他们还计划推出HBM3E高速存储器、PCIe 6.0和PCIe 7.0、以及NVLink、224G SerDes、1.6T接口等先进技术，如果计划成功，NVIDIA将超越所有潜在的竞争对手［2］。

　　尽管硬件和芯片领域的创新不断突破，但其发展仍然受到第一性原理的限制，存在天然物理边界的约束。通过深入了解工艺制程、先进封装、内存和互联等多个技术路线，可以推断出未来NVIDIA可能采用的技术路径。

　　尽管基于第一性原理的推演成功率高，但仍需考虑非技术因素的影响。例如，通过供应链控制，在一定时间内垄断核心部件或技术的产能，如HBM、TSMC CoWoS先进封装工艺等，可以影响技术演进的节奏。

　　根据NVIDIA 2023年Q4财报，该公司季度收入达到76.4亿美元，同比增长53%，创下历史新高。全年收入更是增长61%，达到269.1亿美元的纪录。数据中心业务在第四季度贡献了32.6亿美元的收入，同比增长71%，环比增长11%。财年全年数据中心收入增长58%，达到创纪录的106.1亿美元［3］。

　　因此NVIDIA拥有足够大的现金流可以在短时间内对供应链，甚至产业链施加影响。另外，也存在一些黑天鹅事件也可能产生影响，比如以色列和哈马斯的战争就导致了NVIDIA取消了原定于10月15日和16日举行的AI SUMMIT ［4］。业界原本预期，NVIDIA将于峰会中展示下一代B100 GPU芯片［5］。值得注意的是，NVIDIA的网络部门前身Mellanox正位于以色列。

　　为了避免陷入不可知论，本文的分析主要基于物理规律的第一性原理，而不考虑经济手段（例如控制供应链）和其他可能出现的黑天鹅事件（例如战争）等不确定性因素。

　　当然，这些因素有可能在技术链条的某个环节产生重大影响，导致技术或者产品演进节奏的放缓，或者导致整个技术体系进行一定的微调，但不会对整个技术演进趋势产生颠覆式的影响。

　　考虑到这些潜在的变化，本文的分析将尽量采取一种客观且全面的方式来评估这些可能的技术路径。我们将以“如果A那么X；如果B那么Y；…”的形式进行思考和分析，旨在涵盖所有可能影响技术发展的因素，以便提供更准确、更全面的分析结果。

　　此外，本文分析是基于两到三年各个关键技术的路标假设，即2025年之前。当相应的前提条件变化，相应的结论也应该作适当的调整，但是整体的分析思路是普适的。

　　01. NVIDIA的AI布局

　　NVIDIA在人工智能领域的布局堪称全面，其以系统和网络、硬件和软件为三大支柱，构建起了深厚的技术护城河［6］。

　　有分析称NVIDIA的H100显卡有高达90%的毛利率。NVIDIA通过扶持像Coreweave这样的GPU云服务商，利用供货合同让他们从银行获取资金，然后购买更多的H100显卡，锁定未来的显卡需求量。

　　这种模式已经超出传统硬件公司的商业模式，套用马克思在资本论中所述“金银天然不是货币，货币天然是金银。”，有人提出了“货币天然不是H100，但H100天然是货币”的说法［7］。这一切的背后在于对于对未来奇点临近的预期［8］，在于旺盛的需求，同时更在于其深厚的技术护城河。

　　NVIDIA 2019年3月发起对Mellanox的收购［9］，并且于2020年4月完成收购［10］，经过这次收购NVIDIA获取了InfiniBand、Ethernet、SmartNIC、DPU及LinkX互联的能力。面向GPU互联，自研NVLink互联和NVLink网络来实现GPU算力Scale Up扩展，相比于基于InfiniBand网络和基于Ethernet的RoCE网络形成差异化竞争力。

　　NVLink自2014年推出以来，已经历了四个代际的演进，从最初的2014年20G NVLink 1.0，2018年25G NVLink 2.0，2020年50G NVLink 3.0 到2022年的100G NVLink 4.0，预计到2024年，NVLink将进一步发展至200G NVLink 5.0。在应用场景上，NVLink 1.0至3.0主要针对PCIe板内和机框内互联的需求，通过SerDes提速在与PCIe互联的竞争中获取显著的带宽优势。

　　值得注意的是，除了NVLink 1.0采用了20G特殊速率点以外，NVLink 2.0~4.0皆采用了与Ethernet相同或者相近的频点，这样做的好处是可以复用成熟的Ethernet互联生态，也为未来实现连接盒子或机框组成超节点埋下伏笔。

　　NVSwitch 1.0、2.0、3.0分别与NVLink 2.0、3.0、4.0配合，形成了NVLink总线域网络的基础。NVLink4.0配合NVSwitch3.0组成了超节点网络的基础，这一变化的外部特征是NVSwitch脱离计算单板而单独成为网络设备，而NVLink则从板级互联技术升级成为设备间互联技术。

　　在计算芯片领域，NVIDIA于2020年9月发起Arm收购，期望构建人工智能时代顶级的计算公司［11］，这一收购提案因为面临重大监管挑战阻碍了交易的进行，于2022年2月终止［12］。但是，在同年3月其发布了基于Arm的Grace CPU Superchip超级芯片［13］。成为同时拥有CPU、GPU和DPU的计算芯片和系统公司。

　　从业务视角看，NVIDIA在系统和网络、硬件、软件三个方面占据了主导地位［6］。

　　系统和网络、硬件、软件这三个方面是人工智能价值链中许多大型参与者无法有效或快速复制的重要部分，这意味着NVIDIA在整个生态系统中占据着主导地位。

　　要击败NVIDIA就像攻击一个多头蛇怪。必须同时切断所有三个头才有可能有机会，因为它的每个“头”都已经是各自领域的领导者，并且NVIDIA正在努力改进和扩大其护城河。

　　在一批人工智能硬件挑战者的失败中，可以看到，他们都提供了一种与NVIDIA GPU相当或略好的硬件，但未能提供支持该硬件的软件生态和解决可扩展问题的方案。而NVIDIA成功地做到了这一切，并成功抵挡住了一次冲击。这就是为什么NVIDIA的战略像是一个三头水蛇怪，后来者必须同时击败他们在系统和网络、硬件以及软件方面的技术和生态护城河。

　　目前，进入NVIDIA平台似乎能够占据先机。OpenAI、微软和NVIDIA显然处于领先地位。尽管Google和Amazon也在努力建立自己的生态系统，但NVIDIA提供了更完整的硬件、软件和系统解决方案，使其成为最具吸引力的选择。

　　要赢得先机，就必须进入其硬件、软件和系统级业务生态。然而，这也意味着进一步被锁定，未来更难撼动其地位。从Google和Amazon等公司的角度来看，如果不选择接入NVIDIA的生态系统，可能会失去先机；而如果选择接入，则可能意味着失去未来。

　　NVIDIA布局了两种类型网络，一种是传统InfiniBand和Ethernet网络，另一种是NVLink总线域网络。

　　在传统网络中，Ethernet面向AIGC Cloud多AI训练和推理等云服务，而InfiniBand面向AI Factory，满足大模型训练和推理的应用需求。在交换芯片布局方面，有基于开放Ethernet增强的Spectrum-X交换芯片和基于InfiniBand的封闭高性能的Quantum交换芯片。

　　当前Ultra Ethernet Consortium（UEC）正在尝试定义基于Ethernet的开放、互操作、高性能的全栈架构，以满足不断增长的AI和HPC网络需求［14］，旨在与NVIDIA的网络技术相抗衡。

　　UEC的目标是构建一个类似于InfiniBand的开放协议生态，从技术层面可以理解为将Ethernet进行增强以达到InfiniBand网络的性能，或者说是实现一种InfiniBand化的Ethernet。

　　从某种意义上说UEC在重走InfiniBand道路。总线域网络NVLink的主要特征是要在超节点范围内实现内存语义级通信和总线域网络内部的内存共享，它本质上是一个Load-Store网络，是传统总线网络规模扩大以后的自然演进。

　　从NVLink接口的演进历程可以看出，其1.0~3.0版本明显是对标PCIe的，而4.0版本实际上对标InfiniBand和Ethernet的应用场景，但其主要目标还是实现GPU的Scale Up扩展。

　　从原始需求的角度来看，NVLink网络在演进过程中需要引入传统网络的一些基本能力，例如编址寻址、路由、均衡、调度、拥塞控制、管理控制和测量等。

　　同时，NVLink还需要保留总线网络基本特征，如低时延、高可靠性、内存统一编址共享以及内存语义通信。这些特征是当前InfiniBand或Ethernet网络所不具备的或者说欠缺的。

　　与InfiniBand和Ethernet传统网络相比，NVLink总线域网络的功能定位和设计理念存在着本质上的区别。我们很难说NVLink网络和传统InfiniBand网络或者增强Ethernet网络最终会殊途同归。

　　NVIDIA在AI集群竞争态势中展现出了全面布局，涵盖了计算（芯片、超级芯片）和网络（超节点、集群）领域。

　　在计算芯片方面，NVIDIA拥有CPU、GPU、CPU-CPU/CPU-GPU SuperChip等全面的布局；在超节点网络层面，Nvidia提供了NVLink和InfiniBand两种定制化网络选项；在集群网络方面，NVIDIA有基于Ethernet的交换芯片和DPU芯片布局。

　　AMD紧随其后，更专注于CPU和GPU计算芯片，并采用基于先进封装的Chiplet芯粒技术。

　　与NVIDIA不同的是，AMD当前没有超级芯片的概念，而是采用了先进封装将CPU和GPU Die合封在一起。AMD使用私有的Infinity Fabric Link内存一致接口进行GPU、CPU、GPU和CPU间的互联，而GPU和CPU之间的互联仍然保留传统的PCIe连接方式。

　　此外，AMD计划推出XSwitch交换芯片，下一代MI450加速器将利用新的互连结构，其目的显然是与NVIDIA的NVSwitch竞争［15］。

　　BRCM则专注于网络领域，在超节点网络有对标InfiniBand的Jericho3-AI+Ramon的DDC方案；在集群网络领域有基于Ethernet的Tomahawk系列和Trident系列交换芯片。

　　近期BRCM推出其新的软件可编程交换Trident 5-X12集成了NetGNT神经网络引擎实时识别网络流量信息，并调用拥塞控制技术来避免网络性能下降，提高网络效率和性能［16］。

　　Cerebras/Telsa Dojo则“剑走偏锋”，走依赖“晶圆级先进封装”的深度定制硬件路线。

　　02. 工程工艺洞察和推演假设

　　1、半导体工艺演进洞察

　　根据IRDS的乐观预测，未来5年，逻辑器件的制造工艺仍将快速演进，2025年会初步实现Logic器件的3D集成。TSMC和Samsung将在2025年左右开始量产基于GAA（MBCFET）的2nm和3nm制程的产品［17］。

　　按照TSMC给出的工艺演进路标，2023~2025年基本以3nm工艺为主，2nm工艺在2025年以后才会发布。3nm技术已经进入量产阶段，N3工艺和N3E版本已经于2023年推出。2024年下半年开始生产N3P版本，该版本将提供比N3E更高的速度、更低的功耗和更高的芯片密度。此外，N3X版本将专注于高性能计算应用，提供更高的时钟频率和性能，预计将于2025年开始量产［18］。工艺演进的收益对于逻辑器件的收益小于50%，因此，未来单芯片算力提升将更依赖于先进封装技术。

　　2、先进封装演进洞察

　　TSMC的CoWoS先进封装工艺封装基板的尺寸在2023年为4倍Reticle面积，2025年将达到6倍Reticle面积［19］。当前NVIDIA H100 GPU的封装基板尺寸小于2倍Reticle面积，AMD的MI300系列GPU的封装基板尺寸大约为3.5倍Reticle面积，逼近当前TSMC CoWoS-L工艺的极限。

　　3、HBM内存演进洞察

　　HBM内存的容量预计将在2024年达到24GB，并在2025年进一步增长至36GB ［20］。HBM4预计将带来两个重要的变化：首先，HBM接口位宽将从1024扩展到2048；其次，业界正在尝试将HBM内存Die直接堆叠在逻辑Die的上方［21］［22］。这两个变化意味着HBM内存的带宽和单个封装内能容纳的容量都将持续增长。

　　据报道，SK海力士已经开始招聘CPU和GPU等逻辑半导体的设计人员。该公司显然正在考虑将HBM4直接堆叠在处理器上，这不仅会改变逻辑和存储器设备的传统互连方式，还会改变它们的制造方式。事实上，如果SK海力士成功实现这一目标，这可能会彻底改变芯片代工行业［21］［22］。

　　4、推演假设

　　本文基于两个前提假设来推演NVIDIA未来AI芯片的架构演进。首先，每一代AI芯片的存储、计算和互联比例保持大致一致，且比上一代提升1.5到2倍以上；其次，工程工艺演进是渐进且可预测的，不存在跳变，至少在2025年之前不会发生跳变。

　　到2025年，工艺将保持在3nm水平，但工艺演进给逻辑器件带来的收益预计不会超过50%。同时，先进封装技术预计将在2025年达到6倍Reticle面积的水平。此外，HBM内存容量也将继续增长，预计在2024年将达到24GB，而在2025年将达到36GB。

　　03. NVIDIA AI芯片架构解读

　　互联技术在很大程度上决定了芯片和系统的物理架构。NVIDIA利用NVLink-C2C这种低时延、高密度、低成本的互联技术来构建SuperChip超级芯片，旨在兼顾性能和成本打造差异化竞争力。与传统的SerDes互联相比，NVLink C2C采用了高密度单端架构和NRZ调制，使其在实现相同互联带宽时能够在时延、功耗、面积等方面达到最佳平衡点；而与Chiplet Die-to-Die互联相比，NVLink C2C具备更强的驱动能力，并支持独立封装芯片间的互联，因此可以使用标准封装，满足某些芯片的低成本需求。

　　为了确保CPU和GPU之间的内存一致性操作（Cache-Coherency），对于NVLink C2C接口有极低时延的要求。

　　H100 GPU的左侧需要同时支持NVLink C2C和PCIe接口，前者用于实现与NVIDIA自研Grace CPU组成Grace-Hopper SuperChip，后者用于实现与PCIe交换芯片、第三方CPU、DPU、SmartNIC对接。NVLink C2C的互联带宽为900GB/s，PCIe互联带宽为128GB/s。

　　而当Hopper GPU与Grace CPU组成SuperChip时，需要支持封装级的互联。值得注意的是，Grace CPU之间也可以通过NVLink C2C互联组成Grace CPU SuperChip。考虑到成本因素，NVIDIA没有选择采用双Die合封的方式组成Grace CPU，而是通过封装间的C2C互联组成SuperChip超级芯片。

　　从时延角度来看，NVLink C2C采用40Gbps NRZ调制，可以实现无误码运行（BER《1e-12），免除FEC，接口时延可以做到小于5ns。相比之下，112G DSP架构的SerDes本身时延可以高达20ns，因为采用了PAM4调制，因此还需要引入FEC，这会额外增加百纳秒量级的时延。此外，NVLink C2C采用了独立的时钟线来传递时钟信号，因此数据线上的信号不需要维持通信信号直流均衡的编码或扰码，可以进一步将时延降低到极致。

　　因此，引入NVLink C2C的主要动机是满足芯片间低时延互联需求。

　　从互联密度来看，当前112G SerDes的边密度可以达到12.8Tbps每边长，远远大于当前H100的（900+128）GB/s * 8/2 = 4.112Tbps的边密度需求。NVLink C2C的面密度是SerDes的3到4倍，（169Gbps/mm2 vs. 552Gbps/mm2）。而当前NVLink C2C的边密度还略低于SerDes（281Gbps/mm vs. 304Gbps/mm）。更高的边密度显然不是NVLink C2C需要解决的主要矛盾。

　　从驱动能力来看，112G SerDes的驱动能力远大于NVLink C2C。这在一定程度上会制约NVLink C2C的应用范围，未来类似于NVLink C2C的单端传输线技术有可能进一步演进，拓展传输距离，尤其是在224G及以上SerDes时代，芯片间互联更加依赖于电缆解决方案，这对与计算系统是不友好的，会带来诸如芯片布局、散热困难等一系列工程挑战，同时也需要解决电缆方案成本过高的问题。

　　从功耗来看，112G SerDes的功耗效率为5.5pJ/bit，而NVLink C2C的功耗效率为1.3pJ/bit。在3.6Tbps互联带宽下，SerDes和NVLink C2C的功耗分别为19.8W和4.68W。虽然单独考虑芯片间互联时，功耗降低很多，但是H100 GPU芯片整体功耗大约为700W，因此互联功耗在整个芯片功耗中所占比例较小。

　　从成本角度来看，NVLink C2C的面积和功耗优于SerDes互联。因此，在提供相同互联带宽的情况下，它可以节省更多的芯片面积用于计算和缓存。然而，考虑到计算芯片并不是IO密集型芯片，因此这种成本节约的比例并不显著。但是，如果将双Chiplet芯粒拼装成更大规模的芯片时，NVLink C2C可以在某些场景下可以避免先进封装的使用，这对降低芯片成本有明显的帮助，例如Grace CPU SuperChip超级芯片选择标准封装加上NVLink C2C互联的方式进行扩展可以降低成本。在当前工艺水平下，先进封装的成本远高于逻辑Die本身。

　　C2C互联技术的另一个潜在的应用场景是大容量交换芯片，当其容量突破200T时，传统架构的SerDes面积和功耗占比过高，给芯片的设计和制造带来困难。在这种情况下，可以利用出封装的C2C互联技术来实现IO的扇出，同时尽量避免使用先进的封装技术，以降低成本。然而，目前的NVLink C2C技术并不适合这一应用场景，因为它无法与标准SerDes实现比特透明的转换。因此，需要引入背靠背的协议转换，这会增加时延和面积功耗。

　　Grace CPU具有上下翻转对称性，因此单个芯片设计可以支持同构Die组成SuperChip超级芯片。Hopper GPU不具备上下和左右翻转对称性，未来双Die B100 GPU芯片可能由两颗异构Die组成。

　　NVLink和NVLink C2C技术提供了更灵活设计，实现了CPU和GPU灵活配置，可以构建满足不同应用需求的系统架构。NVLink C2C可以提供灵活的CPU、GPU算力配比，可组成 1/0，0.5/1，0.5/2，1/4，1/8等多种组合的硬件系统。

　　NVLink C2C支持Grace CPU和Hopper GPU芯片间内存一致性操作（Cache-Coherency），让Grace CPU成为Hopper GPU的内存控制器和IO扩展器，实现了4倍IO带宽和5倍内存容量的扩展。这种架构打破了HBM的瓶颈，实现了内存超发。对训练影响是可以缓存更大模型，利用ZeRO等技术外存缓存模型，带宽提升能减少Fetch Weight的IO开销。对推理影响是可以缓存更大模型，按需加载模型切片推理，有可能在单CPU-GPU超级芯片内完成大模型推理［23］。

　　有媒体测算NVIDIA的H100利润率达到90%。同时也给出了估算的H100的成本构成，NVIDIA向台积电下订单，用N4工艺制造GPU芯片，平均每颗成本155美元。NVIDIA从SK海力士（未来可能有三星、美光）采购六颗 HBM3芯片，成本大概2000美元。台积电生产出来的GPU和NVIDIA采购的HBM3芯片，一起送到台积电CoWoS封装产线，以性能折损最小的方式加工成H100，成本大约723美元［24］。

　　先进封装成本高，是逻辑芯片裸Die成本的3到4倍以上， GPU内存的成本占比超过60%。按照DDR： 5美金/GB，HBM： 15美金/GB以及参考文献［25］［26］中给出的GPU计算Die和先进封装的成本测算，H100 GPU HBM成本占比为62.5%；GH200中HBM和LPDDR的成本占比为78.2%。

　　虽然不同来源的信息对各个部件的绝对成本估算略有不同，但可以得出明确的结论：内存在AI计算系统中的成本占比可高达60%到70%以上；先进封装的成本是计算Die成本的3到4倍以上。在接近Reticle面积极限的大芯片良率达到80%的情况下，先进封装无法有效地降低成本。因此，应该遵循非必要不使用的原则。

　　04. 与AMD和Intel GPU架构对比

　　AMD的GPU相对于NVIDIA更加依赖先进封装技术。MI250系列GPU采用了基于EFB硅桥的晶圆级封装技术，而MI300系列GPU则应用了AID晶圆级有源封装基板技术。相比之下，NVIDIA并没有用尽先进封装的能力，一方面在当前代际的GPU中保持了相对较低的成本，另一方面也为下一代GPU保留了一部分工程工艺的价值发挥空间。

　　Intel Ponte Vecchio GPU将Chiplet和先进封装技术推向了极致，它涉及5个工艺节点（包括TSMC和Intel两家厂商的不同工艺），47个有源的Tile，并同时采用了EMIB 2.5D和Foveros 3D封装技术。可以说，它更像是一个先进封装技术的试验场。

　　Intel的主力AI芯片是Gaudi系列AI加速芯片［27］［28］［29］。值得注意的是，Gaudi系列AI芯片是由TSMC代工的，Gaudi 2采用的是TSMC 7nm工艺，Gaudi 3采用的是TSMC 5nm工艺。

　　05. NVIDIA未来AI芯片架构推演

　　1、NVLink和NVLink C2C演进推演

　　互联技术在很大程度上塑造了芯片和系统的物理架构。从互联技术的发展历程出发，以芯片布局为线索，并考虑工程工艺的物理限制，可以对NVIDIA未来AI芯片架构进行预测。这种推演也有助于发掘对互联技术的新需求。

　　互联技术的演进是一个渐进的过程，其基本技术要素如带宽、调制和编码等都遵循着其内在的发展规律。这些物理规律相对稳定，通过将这些技术进行组合并结合当前工程工艺的发展趋势以及需求，就可以大致描绘和预测出互联技术的发展方向。在这里不深入探讨晦涩难懂的互联技术本身的发展，而是从宏观技术逻辑和外在可观察的指标两个角度出发，探讨NVLink和NVLink C2C的历史演进，并对其未来发展进行预测。

　　从NVLink的演进看，当前其演进了四个代际，NVLink C2C当前只有一个代际，通过与当下不同协议的速率演进对比及NVLink宣传材料，可以清晰的看到每个代际的NVLink技术的竞争对手和其要解决的痛点问题。

　　当前接口有两大开放的互联生态，PCIe互联生态和Ethernet互联生态，CXL协议依托于PCIe互联生态，而InfiniBand则依托与Ethernet互联生态。

　　NVLink的主要目标是解决GPU之间的互联问题，而早期的GPU一定需要保留与CPU互联的PCIe接口，用于GPU互联是也天然的继承了这一技术，因此NVLink早期的竞争对手是PCIe。从PCIe、Ethernet和NVLink的发展轨迹来看，NVLink的SerDes速率介于同时期PCIe和Ethernet SerDes速率之间。

　　这意味着NVLink利用了Ethernet生态成熟的互联技术来对抗PCIe，实现接口速率超越PCIe。通过复用Ethernet生态的成熟互联技术，NVLink在成本方面也具有优势。

　　值得注意的是，NVLink并未完全遵循Ethernet的互联技术规范。例如，在50G NVLink 3.0采用了NRZ调制，而不是Ethernet所采用的PAM4调制［30］。

　　这意味着NVLink 3.0利用了100Gbps PAM4 SerDes代际的技术，并通过采用更低阶NRZ调制来实现链路的无误码运行，免去FEC实现低时延。

　　同样以低时延著称的InfiniBand在50G这一代际则完全遵从了Ethernet的PAM4调制，这在一定程度上使其在50G这一代际丧失了低时延的技术优势，市场不得不选择长期停留在25G代际的InfiniBand网络上。

　　当然，InfiniBand网络也有其无奈之处，因为它需要复用Ethernet光模块互联生态，所以它必须完全遵循Ethernet的互联电气规范，而与之对应的NVLink 3.0则只需要解决盒子内或机框内互联即可。

　　同样的事情也会在100G代际的NVLink 4.0上发生，NVLink 4.0完全摆脱了盒子和框子的限制，实现了跨盒子、跨框的互联，此时为了复用Ethernet的光模块互联生态，NVLink 4.0的频点和调制格式也需要遵从Ethernet互联的电气规范。

　　以前InfiniBand遇到的问题，NVLink也同样需要面对。在100G时代，可以观察到Ethernet、InfiniBand和NVLink的SerDes速率在时间节奏上齐步走的情况。实际上，这三种互联接口都采用了完全相同的SerDes互联技术。同样的情况在200G这一代际也会发生。

　　与InfiniBand和Ethernet不同的是，NVLink是一个完全私有的互联生态，不存在跨速率代际兼容、同代际支持多种速率的接口和多厂商互通的问题。因此，在技术选择上，NVLink可以完全按照具体应用场景下的需求来选择设计甜点，在推出节奏上可以根据竞争情况自由把控，也更容易实现差异化竞争力和高品牌溢价。

　　NVLink的发展可以分为两个阶段。

　　NVLink 1.0~3.0主要在盒子内、机框内实现GPU高速互联，对标PCIe。它利用了Ethernet SerDes演进更快的优势，采用了更高速的SerDes，同时在NVLink2.0时代开始引入NVSwitch技术，在盒子内、机框内组成总线域网络，在带宽指标上对PCIE形成了碾压式的竞争优势。

　　NVLink 4.0以后NVLink走出盒子和机框，NVSwitch走出计算盒子和机框，独立成为网络设备，此时对标的是InfiniBand和Ethernet网络。

　　虽然NVLink 4.0没有公开的技术细节，但是从NVLink网络的Load-Store网络定位和满足超节点内部内存共享的需求上看，一个合理的推测是，NVLink 4.0很可能采用了轻量FEC加链路级重传的技术支持低时延和高可靠互联。在时延和可靠性竞争力指标上对InfiniBand和Ethernet形成碾压式的竞争力，这更有利于实现内存语义网络，支持超节点内内存共享。提供传统网络所不能提供的关键特性，才是NVLink作为总线域网络独立存在的理由。

　　基于NVLink C2C的产品目前只有GH200这一代，但是从NVIDIA在该领域公开发表的论文中可以大致看出其技术发展的脉络。从技术演进上看，它是封装内Die间互联的在均衡上的增强。从NVIDIA SuperChip超级芯片路标来看，它将在未来的AI芯片中继续发挥重要作用。对于这类接口，仍需保持连接两个独立封装芯片的能力和极低的时延和功耗。

　　当前的NVLink C2C采用9*40Gbps NRZ调制方式。

　　未来NVLink-C2C可能会向更高速率和双向传输技术方向演进。而50G NRZ是C2C互联场景下在功耗和时延方面的设计甜点。继续维持NRZ调制，选择合适工作频率，走向双向传输将是实现速率翻倍的重要技术手段。

　　虽然NVLink C2C针对芯片间互联做了优化设计，但由于它与标准SerDes之间不存在速率对应关系，无法实现与标准SerDes之间比特透明的信号转换，因此其应用场景受限。在与标准SerDes对接时需要多引入一层协议转化会增加时延、面积和功耗开销。未来可能存在一种可

　　能性，即采用类似NVLink C2C这种高密单端传输技术，同时与标准SerDes实现多对一的速率匹配，这种技术一旦实现将极大地扩展C2C高密单端互联技术的应用空间，也有可能开启SerDes面向更高速率演进的新赛道。

　　从NVLink和NVSwitch的演进来看，每一代速率会是上一代的1.5到2倍。下一代NVLink 5.0大概率会采用200G每通道，每个GPU能够出的NVLink接口数量从18个增加到32个，甚至更高。而NVSwitch 4.0在端口速率达到200G以外，交换芯片的端口数量可能在NVSwitch 3.0交换芯片64端口的基础上翻2倍甚至4倍，总交换容量从12.8T到25.6T甚至51.2T ［30］。

　　2、B100 GPU架构推演

　　以H100 GPU芯片布局为基础，通过先进的封装技术将两颗类似H100大小的裸Die进行合封，可以推演B100 GPU架构。 B100 GPU有两种“双Die”推演架构：IO边缝合和HBM边缝合［31］［32］。“HBM边缝合”利用H100的HBM边进行双Die连接，这种方案的优点在于，它可以使得IO可用边长翻倍，从而有利于扩展IO带宽。然而，它的缺点在于HBM可用边长并没有改变，因此无法进一步扩展HBM容量。 “IO边缝合”利用H100的IO边进行双Die连接，这种方案的优势在于HBM可用边长能够翻倍，从而有利于扩展内存。然而，它的缺点在于IO可用边长并未改变，因此需要进一步提升IO密度。考虑到每代芯片与上一代相比，在内存、算力、互联三个层面需要实现两倍以上的性能提升，采用“IO 边缝合”方案的可能性更大。采用“IO 边缝合”的方案需要提升IO的边密度。

　　H100不具备旋转对对称性，而双Die的B100仍需支持GH200 SuperChip超级芯片，因此B100可能由两颗异构Die组成。按照不同的长宽比采用“IO边缝合的方式”B100的面积达到3.3到3.9倍的Reticle面积，小于当前TSMC CoWoS先进封装能够提供的4倍Reticle面积的能力极限。计算Die之间互联可以复用 NVLink C2C 互联技术，既利用NVLink C2C出封装的连接能力覆盖Die间互联的场景。

　　为了实现计算Die的归一化，可以将IO从计算Die中分离出来，形成独立的IO Die。这样，计算Die的互联接口就实现了归一化，使计算Die具备了旋转对称性。在这种情况下，仍然存在两种架构：一种是同构计算Die与IO Die合封，另一种是计算Die与IO Die分别封装并用C2C互联将二者连接。计算Die的同构最大的优势在于可以实现芯片的系列化。通过灵活组合计算Die和IO Die，可以实现不同规格的芯片以适应不同的应用场景的需求。

　　NVIDIA B100有“异构Die合封”，“计算Die与IO Die分离，同构计算Die与IO Die合封”，“计算Die与IO Die分离并分别封装，并用C2C互联将二者连接”三种架构选项。 NVIDIA B100如果采用单封装双Die架构，封装基板面积达到3.3~3.9倍Reticle面积，功耗可能超过1kW。计算Die之间互联可以复用NVLinkC2C互联技术。将计算Die和IO Die分离可以实现计算Die的同构化，降低成本。利用NVLink C2C出封装互联的能力，可以将IO扇出，降低IO边密度压力。需要注意的是，当前NVLink C2C速率与PCIe & NVLink的SerDes无法匹配，因此需要IO Die上作协议转换，无法做到协议无关。如果C2C互联和SerDes速率能够进行多对一的匹配实现比特透明的CDR，这样可以消除协议转换的开销。考虑到B100 2024年推出的节奏，方案一、三匹配当前先进封装能力，但方案三需要引入额外的协议转换；方案二超出当前先进封装能力。

　　注：其中关于Blackwell架构的谜底已经在美国圣何塞当地时间3月18日举行的NVIDIA GTC大会上揭晓，详情可参见《详解最强AI芯片架构：英伟达Blackwell GPU究竟牛在哪？》。对于采用两个GPU Die+1个CPU的GH200架构，陆玉春博士补充复盘道：“同一封装大概率没有IO Die，所以当时猜测的是异构Die。用同一个Socket的B100封装内采用同构Die 180度旋转这块也有一些偏差，回头刷一下对这个架构的洞察。如果GB200采用双Socket的话其实这个问题就好猜了，两个B100的连接实际上是依赖两个边上的NVLink C2C互联的，这个时候是否遵循旋转对称性问题不大。有点儿超乎想象的是GB200的2 Socket 4 Die和文中的X100的对上了。未来GX200怎么搞就值得期待了。Nvidia的策略还是更激进的。这个预测和推演还是偏保守了。”

　　3、X100 GPU架构推演

　　NVIDIA X100如果采用单Socket封装四Die架构，封装基板面积将超过6倍Reticle面积，这将超出2025年的先进封装路标的目标。而如果采用双Socket封装架构，则需要使用10~15cm的C2C互联技术来实现跨封装的计算 Die间的互联，这可能需要对当前NVLink C2C的驱动能力进一步增强。 NVIDIA X100 GPU如果采用四Die架构，如果要控制封装基板面积在6倍Reticle面积以下，匹配2025年先进封装路标，则需要在计算Die上通过3D堆叠的方式集成HBM ［21］［22］。因此X100如果不采用SuperChip超级芯片的架构而是延续单封装架构，要想在2025年推出，技术挑战非常大。一方面需要先进封装基板达到6倍Reticle面积，另一方面需要实现在计算Die上堆叠HBM，同时要解决HBM和计算Die堆叠带来的芯片散热问题。

　　在满足2025年的工程约束的前提下，X100也可以采用SuperChip超级芯片架构在B100双Die架构的基础上进行平面扩展。在这种情况下，NVIDIA X100也有“异构Die合封”，“同构计算Die与IO Die合封”，“计算Die与IO Die分别封装”三种架构选项。如果采用封装间互联的超级芯片的扩展方式，先进封装的基板面积约束将不再会是瓶颈，此时只需要增强NVLink C2C的驱动能力。

　　06. H100/H200，B100，X100

　　GPU架构演进总结

　　基于以下两个前提：每一代AI芯片的存储、计算和互联比例保持大致一致，且比上一代提升1.5到2倍以上；工程工艺演进是渐进且可预测的，不存在跳变，至少在2025年之前不会发生跳变。因此，可以对2023年的H100、2024年的B100和2025年的X100的架构进行推演总结。对于工程工艺的基本假设如下：到2025年，工艺将保持在3nm水平，但工艺演进给逻辑器件带来的收益预计不会超过50%。同时，先进封装技术预计将在2025年达到6倍 Reticle面积的水平。此外，HBM内存容量也将继续增长，预计在2024年将达到24GB，而在2025年将达到36GB。在上述前提假设条件下，针对H100/H200， B100， X100 GPU可以得到如下推演结论：

　　1. H200是基于H100的基础上从HBM3升级到HBM3e，提升了内存的容量和带宽。

　　2. B100将采用双Die架构。如果采用异构Die合封方式，封装基板面积将小于当前先进封装4倍Reticle面积的约束。而如果采用计算Die和IO Die分离，同构计算Die和IO Die合封的方式，封装基板面积将超出当前先进封装4倍Reticle面积的约束。如果采用计算Die和IO Die分离，同构计算Die和IO Die分开封装的方式，则可以满足当前的工程工艺约束。考虑到B100 2024年推出的节奏，以及计算Die在整个GPU芯片中的成本占比并不高，因此用异构Die合封方式的可能性较大。 3. 如果X100采用单Socket封装，四个异构Die合封装的方式，需要在计算Die上堆叠HBM，同时需要先进封装的基板达到6倍Reticle面积。但是，如果采用SuperChip超级芯片的方式组成双Socket封装模组，可以避免计算Die上堆叠HBM，并放松对先进封装基板面积的要求，此时需要对NVLink C2C的驱动能力做增强。

　　基于B100双Die架构，采用双Socket板级3D扩展可以实现与X100同等的算力。类似的方法也可以应用到X100中进一步扩展算力。板级扩展可以降低对工程工艺的要求，以较低的成本实现算力扩展。虽然基于人们对于先进封装的Chiplet芯粒架构充满了期待，但是其演进速度显然无法满足AI计算系统“三年三个数量级”的增长需求［33］。在AI计算领域基于先进封装Die间互联Chiplet芯粒架构，很可能因为无法满足AI计算领域快速增长的需求而面临“二世而亡”的窘境，业界需要重新寻找旨在提升AI算力的新技术路径，比如SuperChip超级芯片和SuperPOD超节点。因此，类似于NVLink C2C的低时延、高可靠、高密度的芯片间互联技术在未来AI计算芯片的Scale Up算力扩展中将起到至关重要的作用；面向AI集群Scale Out算力扩展的互联技术也同等重要。这两中互联技术，前者是AI计算芯片算力扩展的基础，而后者是AI计算集群算力扩展的基础。

　　07. 结语：总结与思考

　　本文尝试从第一性原理出发，对NVIDIA的AI芯片发展路线进行了深入分析和解读，并对未来的B100和X100芯片架构进行了推演预测。并且，希望通过这种推演提取出未来AI计算系统对互联技术的新需求。本文以互联技术为主线展开推演分析，同时考虑了芯片代际演进的性能提升需求和工程工艺约束。最终得出的结论是：在AI计算领域，基于先进封装Die间互联的Chiplet芯粒架构无法满足AI计算领域快速增长的需求，可能面临“二世而亡”的窘境。低时延、高可靠、高密度的芯片间互联技术在未来AI计算芯片的Scale Up算力扩展中将起到至关重要的作用；虽然未展开讨论，同样的结论也适用于面向AI集群Scale Out算力扩展的互联技术。

　　224G及以上代际中，面向计算集群的互联技术也存在非常大的挑战。需要明确指出的是，互联技术并不是简单地将芯片、盒子、机框连接起来的问题，它并不是一根连线而已，它需要在需求、技术、产业生态等各个方面进行综合考虑，需要极具系统性的创新以及长时间的、坚持不懈的投入和努力。除了互联技术以外，通过对NVIDIA相关技术布局的分析也引发了如下思考：

　　1. 真正的差异化竞争力源于系统性地、全面地掌握整个价值链中主导无法快速复制的关键环节。NVIDIA在系统和网络、硬件、软件这三个方面占据了主导地位，而这三个方面恰恰是人工智能价值链中许多大型参与者无法有效或快速复制的重要部分。然而，要在这三个方面中的任何一方面建立领导地位都离不开长时间坚持不懈的投入和努力带来的技术沉淀和积累。指望在一个技术单点形成突破，期望形成技术壁垒或者技术护城河的可能性为零。“重要且无法快速复制”是核心特征，其中“重要”更容易被理解，而“无法快速复制”则意味着“长时间坚持不懈的投入和努力”带来的沉淀和积累，这是人们往往忽视的因素。

　　2. 开放的产业生态并不等同于技术先进性和竞争力。只有深入洞察特定领域的需求，进行技术深耕，做出差异化竞争力，才能给客户带来高价值，给自身带来高利润。NVIDIA基于NVLink C2C的SuperChip超级芯片以及基于NVLink网络的SuperPOD超节点就是很好的例子。真正构筑核心竞争力的技术是不会开放的，至少在有高溢价的早期不会开放，比如NVIDIA的NVLink和NVLink C2C技术，比如Intel的QPI和UPI。开放生态只是后来者用来追赶强者的借口（比如UEC），同时也是强者用来巩固自己地位的工具（比如PCIe）。然而，真正的强者并不会仅仅满足于开放生态所带来的优势，而是会通过细分领域和构筑特定领域的封闭生态，实现差异化竞争力来保持领先地位。

　　3. 构筑特定领域的差异化竞争力与复用开放的产业生态并不矛盾。其关键在于要在开放的产业生态中找到真正的结合点，并能够果断地做出取舍，勇敢地抛弃不必要的负担，只选择开放产业生态中的精华部分，构建全新的技术体系。为了构筑特定领域的差异化竞争力，更应该积极拥抱开放的产业生态，主动引导其发展以实现这种差异化。比如，InfiniBand与Ethernet在低时延方面的差异化并不是天生的，而是人为构造出来的。两者在基础技术上是相同的。InfiniBand在25G NRZ代际以前抓住了低时延这一核心特征，摒弃跨速率代际兼容的需求，卸掉了技术包袱，并且在HPC领域找到了合适的战场，因此在低时延指标上一直碾压Ethernet，成功实现了高品牌溢价。而InfiniBand在56G PAM4这一代际承袭了Ethernet的互联规范，因此这种低时延上的竞争力就逐渐丧失了。人为制造差异化竞争力的典型例子还有：同时兼容支持InfiniBand和Ethernet的CX系列网卡和BlueField系列DPU；内置在NVSwitch和InfiniBand交换机中的SHARP在网计算协议和技术；NVIDIA基于NVLink C2C构筑SuperChip超级芯片以及基于NVLink网络构筑SuperPOD超节点。

　　4. “天下没有免费的午餐”，这是恒古不变的真理和底层的商业逻辑。商业模式中的“羊毛出在狗身上，由猪买单”其实就是变相的转移支付，羊毛终将是出在羊身上，只是更加隐蔽罢了。这一规律同样适用于对复杂系统中的技术价值的判断上。自媒体分析H100的BOM物料成本除以售价得到90%的毛利率是片面的，因为高价值部分是H100背后的系统竞争力，而不仅仅是那颗眼镜片大小的硅片。这里包含了H100背后的海量的研发投入和技术积累。而隐藏在这背后的实际上是人才。如何对中长期赛道上耕耘的人提供既紧张又轻松的研究环境，使研究人员能安心与具有长期深远影响的技术研究，是研究团队面临的挑战和需要长期思考的课题。从公开发表的D2D和C2C相关文献中可以看到，NVIDIA在这一领域的研究投入超过十年，针对C2C互联这一场景的研究工作也超过五年。在五到十年的维度上长期进行迭代研究，需要相当强的战略定力，同时也需要非常宽松的研究环境和持续的研究投入。

　　5. 在人工智能时代，通过信息不对称来获取差异化竞争力或获得收益的可能性越来越低。这是因为制造信息不对称的难度和代价不断飙升，而其所带来的收益却逐渐减少。在不久的未来，制造信息不对称的代价将会远远超过收益。妄图通过垄断信息而达到差异化的竞争力，浪费的是时间，而失去的是机会。随着大模型的进一步演进发展，普通人可以通过人工智能技术轻松地获取并加工海量的信息且不会被淹没。未来的核心竞争力是如何驾驭包括人工智能在内的工具，对未来技术走向给出正确的判断。

　　6. NVIDIA并非不可战胜，在激进的技术路标背后也隐藏着巨大的风险。如何向资本证明其在AI计算领域的能够长期维持统治地位，保持长期的盈利能力，以维持其高股价、实现持续高速增长，极具挑战性。一旦2025年发布的X100及其配套关键技术不及预期，这将直接影响投资者的信心。这是NVIDIA必须面临的资本世界的考验，在这一点上它并没有制度优势。在一些基础技术层面，业界面临的挑战是一样的。以互联技术为例，用于AI计算芯片Scale Up算力扩展的C2C互联技术，以及面向AI集群Scale Out算力扩展的光电互联技术都存在非常大的挑战。谁能在未来互联技术演进的探索中，快速试错，最快地找到最佳路径，少犯错误，谁就抓住了先机。在未来的竞争中有可能实现超越。

审核编辑：黄飞

阅读全文

NVIDIA(101552) NVIDIA(101552)
gpu(126408) gpu(126408)
英伟达(87542) 英伟达(87542)
AI芯片(34306) AI芯片(34306)

AI芯片卖爆，获益的不止英伟达一家

第三方统计机构预测，到2030年，AI芯片市场将从现在的200亿美元扩张至千亿美元以上。至于从这条大热的赛道上捞金无数的，也不仅仅只有英伟达这一家企业。爆单的晶圆代工厂上一季度，台积电明确表示AI芯片需求旺盛，导致其CoWoS先进封装

2023-11-24 01:17:00

1987

AI发展对芯片技术有什么影响？

现在说AI是未来人类技术进步的一大方向，相信大家都不会反对。说到AI和芯片技术的关系，我觉得主要体现在两个方面：第一，AI的发展要求芯片技术不断进步；第二，AI可以帮助芯片技术向前发展。

2019-08-12 06:38:51

AI芯片怎么分类？

AI芯片作为产业核心，也是技术要求和附加值最高的环节，在AI产业链中的产业价值和战略地位远远大于应用层创新。腾讯发布的《中美两国人工智能产业发展全面解读》报告显示，基础层的处理器/芯片企业数量来看，中国有14家，美国33家。本文将对这一领域产业生态做一个简单梳理。

2019-08-13 08:42:38

AI芯片最新格局分析精选资料分享

来源：中金公司，作者黄乐平、何玫与杨俊杰AI 芯片设计是人工智能产业链的重要一环。自 2017 年 5 月以来，各 AI 芯片厂商的新品竞相发布，经过一年多的发展，各环...

2021-07-23 07:14:08

AI芯片格局最全分析精选资料分享

、各自为政的纷乱局面；特别是每个初创企业的AI芯片都具有自己独特的体系结构和软件开发套件，既无法融入英伟达和谷歌建立的生态圈，又不具备与之抗衡的实力。>>>> 如果说 2016 年 3 月份 AlphaGo

2021-07-23 07:10:29

AI芯片界的领头羊进军机器人行业

算法和大数据时代的到来、以及AI芯片的出现。第三波AI浪潮的发展主要由深度学习技术的突破引领，而英伟达（Nvidia）凭借其通用的GPU单元，专门的TensorRT加速器，强劲的矩阵运算性能加上对其他

2018-06-11 08:20:23

AI开发者福音！阿里云推出国内首个基于英伟达NGC的GPU优化容器

摘要： 3月28日，在2018云栖大会·深圳峰会上，阿里云宣布与英伟达GPU 云合作（NGC），开发者可以在云市场下载NVIDIA GPU 云镜像和运行NGC 容器，来使用阿里云上的NVIDIA

2018-04-04 14:39:24

AI时代推动存储器的创新与发展

AI 时代的计算应用，了解它们如何在未来蓝图中推动创新

2021-01-19 07:48:18

ai芯片和gpu的区别

ai芯片和gpu的区别▌车载芯片的发展趋势(CPU-GPU-FPGA-ASIC)过去汽车电子芯片以与传感器一一对应的电子控制单元(ECU)为主，主要分布与发动机等核心部件上。...

2021-07-27 07:29:46

英伟达 VS. 英特尔：后浪来袭！精选资料分享

上周三，也就是2020年7月8日，是个值得在历史上留下一笔的日子。在这一天美股收盘之后，英伟达的股价收涨2.3%，来到404美元，这...

2021-07-29 07:07:26

英伟达DPU的过“芯”之处

争夺的主战场，而英伟达如何能够在X86的如日中天和云计算客户的自研路线中，找到一个切入到中高端服务器处理器的关键点，刚刚发布的DPU也只能算作一个初步的尝试。未来数据中心的博弈，将围绕AI、超算等所有领域全面展开，英伟达在前有强敌，后有追兵，盟友拥兵自立的境遇下，其数据中心的征程仍然任重而道远。

2022-03-29 14:42:53

英伟达GPU卡多卡互联NVLink，系统累积的公差，是怎么解决的？是连接器吸收的？

英伟达不断推出GPU卡，并且实现多卡互联NVLink，实际整个系统会累积到一个较大的公差，而目前市面上已有的连接器只能吸收较少的公差，这个是怎么做到匹配的呢？

2022-03-05 16:17:06

英伟达GPU惨遭专业矿机碾压，黄仁勋宣布砍掉加密货币业务！

`世界最大的显卡和图形芯片制造商英伟达正式宣布退出加密货币业务。公司首席财务官Colette Kress在声明中表示：“我们认为公司已经进入一个正常时期，公司在预期的未来内并没有加密货币业务。我们在

2018-08-24 10:11:50

英伟达TX2手册

英伟达TX2数据手册，喜欢请关注

2018-01-07 22:08:07

英伟达、寒武纪、GTI的对比，快来看看！(转)

英伟达、寒武纪、GTI的对比　　现在活泼在AI芯片领域的，构成影响力的有Nvidia和华为麒麟970带红的寒武纪等中国新星，他们也有不少创新。但是大部分品牌能做到在终端产品内大容量本地核算，不用

2019-01-22 09:52:58

英伟达发布新一代 GPU 架构图灵和 GPU 系列 Quadro RTX

在 8 月 14 日的 SIGGRAPH 2018 大会上，英伟达 CEO 黄仁勋正式发布了新一代 GPU 架构 Turing（图灵），以及一系列基于图灵架构的 GPU，包括全球首批支持即时光线追踪

2018-08-15 10:59:45

EMC技术：基础概念到应用的解读？|深圳比创达电子.

EMC技术：基础概念到应用的解读？|深圳比创达电子电磁兼容性（Electromagnetic Compatibility，简称EMC）作为一项重要的技术领域，在现代电子设备中扮演着至关重要的角色

2024-03-11 11:59:06

NVIDIA仍不死心，再次加入ARM站场

加强联发科芯片在游戏和AI方面的功能与性能，计划最早于2024年将含有英伟达图形技术的GPU集成到联发科的芯片上。目前联发科已成为Chromebook系统芯片的领先供应商之一，不少廉价

2023-05-28 08:51:03

Nordic发布低功耗蜂窝物联网产品发展蓝图

、汽车(比如基于实际驾驶数据的定制保险)，以及工业和农业自动化。　　 Nordic Semiconductor的低功耗蜂窝IoT产品发展蓝图包括高集成度芯片组和先进的软件，用于即将推出的3GPP

2016-07-17 17:31:34

【AD新闻】赛灵思新CEO访华绘蓝图，7nm ACAP平台要让CPU/GPU难企及

我们业务的核心，但赛灵思今后将不再仅仅是一家FPGA企业。”Peng强调称，FPGA技术是赛灵思的传统，已发展多年，包括在可编程芯片上全面集成了SoC，开发出了3D IC，构建了软件开发框架，并创建

2018-03-23 14:31:40

【NVIDIA社招】英伟达上海热招ASIC验证工程师

【NVIDIA社招】英伟达上海热招ASIC验证工程师一．公司简介 NVIDIA (英伟达™)公司(纳斯达克代码：NVDA)是全球视觉计算技术的行业领袖及GPU(图形处理器)的发明者。作为高性能处理器

2016-11-11 17:38:35

【NVIDIA社招】英伟达上海热招ASIC验证工程师

2016-09-26 10:14:45

【免费直播】让AI芯片拥有最强大脑—AI芯片的操作系统设计介绍.

智慧化进程。人工智能芯片是人工智能发展的基石，是数据、算法和算力在各类场景应用落地的基础依托。“无芯片不AI”已经深入人心，成为业界共识。本次直播将述说AI芯片设计带你解析AI算法及其芯片操作系统

2019-11-07 14:18:45

人工智能AI芯片到底怎么用

什么是人工智能（AI）芯片？AI芯片的主要用处有哪些？在AI任务中，AI芯片到底有多大优势？

2021-09-22 08:00:01

人工智能芯片是人工智能发展的

......无形之中，人工智能正以前所未有的发展速度渗透我们的日常生活。而作为人工智能的核心技术之一，人工智能芯片也向来备受关注。近几年，谷歌、苹果、微软、Facebook、英特尔、高通、英伟达、AMD、阿里巴...

2021-07-27 07:02:46

如何选择具有兼容性发展蓝图的DSP平台？

可编程的DSP可用于实现各种现有的编解码器和将来的编解码标准。目前的趋势是每两年就会发布新的编解码标准，每个新标准会需要更多的DSP周期。因此，选择具有兼容性发展蓝图的DSP平台(如ZSP)非常重要

2019-07-10 06:49:40

微软HoloLens正研发AI芯片可识别语音和图像

对此非常重视。我们的愿望是成为第一大 AI 云。” 　　当然，微软也面临很多竞争。亚马逊也使用了可编程门阵列，还计划使用由英伟达研发的顶级芯片 Volta 来训练 AI 系统。同时，谷歌已经建立了名为

2017-07-31 21:17:15

恩智浦S32V/英伟达DRIVE PX2/TI的TDA4/寒武纪1M/高通SA8155对比分析哪个好？

2021-09-30 07:03:20

新思科技发布业界首款全栈式AI驱动型EDA解决方案Synopsys.ai

摘要：Synopsys.ai可为芯片设计提供AI驱动型解决方案，包含数字、模拟、验证、测试和制造模块。AI引擎可显著提高设计效率和芯片质量，同时降低成本。·英伟达（NVIDIA）、台积公司（TSMC

2023-04-03 16:03:26

瑞芯微和英伟达的边缘计算盒子方案，你会选哪一家的？

高性能，高价值和低成本的边缘计算盒子方案，我爱方案网的小伙伴们特别为工程师朋友们精选了五款热卖的瑞芯微和英伟达的边缘计算盒子方案，这些方案应用于机器人、无人配送车、低空防御、智能巡检、智慧楼宇、网关

2022-09-29 14:31:40

电子元器件+AI创新发展论坛

`物联网时代下，基于大数据和人工智能算法实现的万物互联，重构了新业态、新模式、新发展，为智造业注入新鲜血液。就此，我们特邀知名元器件电商平台、方案商和芯片商一起探讨分享在新的时代背景下，如何通过AI

2017-11-15 14:53:52

联发科回应结盟英伟达合攻 Arm 架构芯片传闻

联发科计划周一下午举行 2023“旗舰科技智领未来”记者会，由联发科 CEO 蔡力行与重量级嘉宾一同出席，这位嘉宾应该是近来引起全球关注、并成为 AI 创新推动者的英伟达 CEO 黄仁勋。早些时候

2023-05-28 08:47:33

超越英伟达Pascal五倍？揭秘英特尔深度学习芯片架构精选资料推荐

在被英特尔收购两年之后，深度学习芯片公司 Nervana 终于准备将代号为「Lake Crest」的架构转化为实际的产品了。对于英特尔来说，现在入局或许有些迟到，英伟达已经占据深度学习芯片市场很长一段时间了，后者有充分的时间通过新...

2021-07-26 07:04:35

高端VR设备起量，英伟达称今年1500万，明年翻倍

VR-ready PC的销量已经突破1500万台。　　在本周的VRX大会上，英伟达总经理格林斯特恩确认了这一消息，使用英伟达GeForce芯片的VR-ready PC销量已经突破1500万台，明年年底这一

2016-12-13 14:32:48

#硬声创作季【科技】科技新闻TechLinked第七期任天堂Switch玩3A大作英伟达AI技术笑傲江

Switch英伟达ai技术行业芯事时事热点

Mr_haohao发布于 2022-09-29 16:26:33

197.再次无理打压！美国命令英伟达对中俄出售高端GPU需要新的许可

gpu英伟达

小凡发布于 2022-10-04 12:25:19

214.国产芯片多点突破，中国首款7nmGPU即将问世，打破英伟达的垄断

gpu英伟达7nm国产芯片

小凡发布于 2022-10-04 12:56:26

233.国产GPU和国外竞争对手的差距在哪里？#国产gpu#英伟达

gpu英伟达

小凡发布于 2022-10-04 13:19:50

267.英伟达对中俄出口高端GPU芯片受新限制

gpu英伟达

小凡发布于 2022-10-04 15:13:52

297.英伟达吹爆的DPU到底是啥？真能做到与CPU、GPU比肩？

DPU英伟达cpu/soc

小凡发布于 2022-10-04 16:02:39

00032 Jetson TX2 NX开发者套件！TX2的性能，NANO的尺寸！ #英伟达 #jetson

英伟达

学习电子知识发布于 2023-07-02 13:21:19

00034 性能爆表！亚博JETSON NANO人工智能开发板，完美兼容官方B01 #英伟达 #jetson

英伟达

学习电子知识发布于 2023-07-02 13:23:09

全新一代Jetson Orin Nano来袭，40TOPS超强算力，刷新你的想象！ #Jetson #英伟达

英伟达

学习电子知识发布于 2023-07-02 13:27:15

从英伟达市值下跌看半导体行业的风云变幻

半导体英伟达

北京中科同志科技股份有限公司发布于 2023-10-19 09:38:56

#消费级显示被禁止出口英伟达RTX 4090显卡遭遇下架风波

英伟达

深圳市浮思特科技有限公司发布于 2023-10-19 15:58:35

#英伟达 #显卡英伟达全新旗舰显卡RTX 5090性能暴涨70%

显卡英伟达

深圳市浮思特科技有限公司发布于 2023-11-20 14:19:25

英伟达为何放不下中国？

英伟达行业资讯

深圳市浮思特科技有限公司发布于 2023-11-27 15:11:09

英伟达HBM4预计2026年推出

英伟达行业资讯

深圳市浮思特科技有限公司发布于 2023-11-27 15:15:17

英伟达将在越南设法人实体

英伟达行业资讯

深圳市浮思特科技有限公司发布于 2023-12-12 10:29:04

英伟达新显卡起售近1.3万元

英伟达行业资讯

深圳市浮思特科技有限公司发布于 2023-12-29 16:56:52

英伟达将用AI设计AI芯片

AI芯片行业资讯

深圳市浮思特科技有限公司发布于 2024-02-19 17:54:43

AI芯片之争，英伟达公开挑战华为 # 华为 #英伟达

行业芯事行业资讯

深圳市浮思特科技有限公司发布于 2024-02-27 14:56:10

英伟达能否在AI芯片领域脱颖而出

英伟达公布2018第四季度财报，因收入不如预期，盘后股价大跌14%。受中国需求减弱影响，美股半导体股呈集体“跳水”趋势。2019年，英伟达能否继续冠名“AI芯片第一股”？这要看下一代7纳米GPU。

2019-02-11 08:36:23

2550

Verint推出AI蓝图助力企业AI投资决策

客户交互企业Verint® Systems Inc.（纳斯达克股票代码：VRNT）日前宣布推出AI（人工智能）蓝图（AI Blueprint™），这是一款获得专利的对话分析系统，能够帮助企业识别智能

2019-04-28 10:20:57

2941

依图挺入“AI芯片”赛道新产品“求索”视觉推理能力超越英伟达

算法即芯片时代来临，云端AI芯片视觉推理超越英伟达

2019-05-11 10:30:27

3066

英伟达逐渐陷入红海 AI芯片在全球呈现群雄逐鹿的竞争格局

对于英伟达，很多人并不陌生，特别是在AI时代，基于英伟达GPU，AI得到高速发展，但此时的英伟达，日子并不好过——股市一路下跌，由顶峰时期1500亿美元，逐渐降至847亿美元。

2019-05-31 16:42:51

715

英伟达和英特尔激战 AI芯片将迎来一场马拉松式的较量

英伟达和英特尔的竞争在AI时代变得更为直白。英伟达在AI训练领域具有绝对优势，英特尔保持着在芯片架构上提供完整解决方案的优势的同时，向英伟达GPU大本营发起挑战，并在AI推理领域建立起了自己的优势。

2019-12-06 17:19:38

835

英伟达收购Arm对芯片设计生态有何影响?

借由Arm架构在移动芯片市场的统治地位，英伟达能够提升AI算力在移动市场的穿透力，进一步拓展AI版图。英伟达表示，此次整合将英伟达领先的 AI 计算平台与 Arm 庞大的生态系统相结合，旨在打造人工智能时代领先的计算公司，在拓展大规模、高增长市场的同时加速创新。

2020-09-15 09:43:30

1566

英伟达：更强的GPU，更快的AI超算

以400亿美元现金加股票的方式，对软银旗下芯片设计公司、全球重要芯片架构提供商Arm进行收购。这两件事情的成功，为英伟达在芯片领域的发展带来了更深入、更广泛的发展前景，以及更为利好的影响。从资本市场的表现就可见一斑，按周一美东时间11月16日16：00收盘时的价格计算，英伟

2020-11-19 18:00:06

2837

解读AI芯片发展现状及前景

，对大规模并行计算能力有很高的要求，CPU和传统计算架构无法满足对于并行计算能力的需求［5］，需要特殊定制的芯片。目前，AI芯片行业已经起步并且发展迅速［6］。 1. AI芯片定义及技术架构 1.1 AI芯片定义广义上所有面向AI应用的芯片都可以称为AI芯片。目前一般认为是针对A

2021-04-30 09:32:06

5082

AMD全力追赶英伟达推出新一代AI芯片

AMD在旧金山发布会上推出了新一代AI芯片、数据中心CPU和DPU。在生成式AI浪潮下，最受关注的新品是AI芯片Instinct MI 300X，直接与英伟达的H100竞争。

2023-06-15 16:16:41

1306

AMD正式出击！推出最新AI芯片挑战英伟达

尽管近段时间，英伟达在AI领域崭露头角，但AMD今日的发布，势必要在算力芯片领域掀起一场“腥风血雨”。

2023-06-16 08:57:54

660

国产AI芯片进展几何？国产AI芯片之争才刚刚开始

近日，芯片巨头AMD推出全新AI GPU MI300系列芯片，与英伟达在AI 算力市场展开竞争。

2023-07-04 09:45:45

1623

如何取替英伟达？如何颠覆英伟达？

随着生成式AI的火热以及英伟达市值冲破万亿美元，如何取替英伟达，成为AI芯片市场新贵，又成为了一个热门话题。

2023-07-10 11:21:26

942

AI芯片市场“百舸争流”！英伟达的“铁王座”还能坐多久？

除了AMD外，英特尔也同样有望成为搅局者。该公司近来反驳了所谓“只有英伟达的芯片才能运行生成式AI”的说法。英特尔在上月底的一篇博客文章中吹嘘了其在最近AI芯片研发中的表现，称其芯片可能是“希望摆脱封闭生态系统的客户的令人信服的选择”。

2023-07-12 11:14:19

366

角逐AI算力，比英伟达最多快10倍，光芯片能成为国产之光吗？

中信建投指出，近年来光计算在AI领域呈现高速的发展，具有广阔的应用前景。以Lightmatter和Lightelligence为代表的公司，推出了新型的硅光计算芯片，性能远超目前的AI算力芯片，据Lightmatter的数据，他们推出的Envise芯片的运行速度比英伟达的A100芯片快1.5到10倍。

2023-07-17 14:47:47

1080

英伟达全球首发超级AI芯片训练大模型成本更低

黄仁勋向数千名开发者和图形专业人士发表讲话，宣布更新 GH200 Grace Hopper 超级芯片、英伟达 AI Workbench，并将把生成式 AI 引入英伟达 Omniverse。

2023-08-09 14:42:55

814

鸿海再夺英伟达大单跃AI服务器芯片基板最大供应商

从nvidia ai供应链的作用来看，在供应链分析中，鸿海是gpu模块（huida ai module）的唯一供应商。英伟达由鸿海（hon hai）和威斯特龙（vestron）供货。英伟达的ai基板供应商有鸿海、广达、video和cmu等。

2023-08-14 09:23:20

633

AI芯片的诞生和发展背景 AI芯片发展的技术方向 AI芯片的发展趋势

高算力需求正催生AI芯片的快速迭代，“无芯片，不AI”，以AI芯片为载体实现的算力正成为人工智能发展水平的重要衡量标准。

2023-08-16 10:11:50

2400

大摩：英伟达财报超预期，台积电等AI供应链将受益

摩根士丹利在报告中表示，英伟达公布业绩将为ai半导体供应链中的营业带来上升空间。特别是，大摩表示，台积电作为英伟达ai芯片的主要晶片工厂和cowos尖端包装的主要供应企业，将获得利润。

2023-08-24 11:27:22

542

英伟达是如何成为AI芯片霸主的？

该公司是 ChatGPT 和其他生成人工智能(AI) 应用程序兴起的最大受益者，几乎所有这些应用程序都由其非常强大的图形处理器提供支持。在此之前，英伟达的芯片也被广泛用于为传统人工智能系统提供动力，在加密货币繁荣期间，对芯片的需求有所增加，因为该行业的系统也依赖于其处理能力。

2023-08-25 15:40:28

638

英国加入全球AI芯片大战

GPU最初是为视频游戏设计的产品，现已成为英伟达成功的核心。ChatGPT等AI模型的动力就是由英伟达芯片提供的。目前英伟达的GPU是全球应用最为广泛的AI 芯片，据称《财富》100强企业中有一半以上都安装了英伟达的AI芯片。

2023-08-26 14:50:28

777

传微软砍单英伟达H100芯片

但中国台湾工厂的ai供应链条方面英伟达ai芯片仍供不应求，但微软到2024年的需求成倍增加有望保持gh200芯片订单上调，ai服务器的长期成长动力是不会改变。”

2023-09-20 11:37:00

634

摆脱重度依赖英伟达，传微软自研首款AI芯片下月问世

聊天机器人chatgpt的问世全球ai热潮，激发了市场对生成式ai技术应用的引起了激烈的争论，企业高层人疯狂地跑在ai芯片的情况下，显卡芯片龙头企业——英伟达的ai芯片供应远远跟不上需求。”

2023-10-09 11:06:50

532

OpenAI计划自研AI芯片，试图超越英伟达的市场份额

据了解，OpenAI至少从去年开始就开始讨论解决AI芯片短缺的方案，包括自研AI芯片、与英伟达等制造商加强合作，并实现供应商多元化，以超越目前市场上占有80%份额的英伟达。

2023-10-09 18:24:40

811

大模型AI芯片群雄逐鹿，谁主沉浮？英伟达NVIDIA？AMD？华为？

将探讨推进芯片快速发展的技术（稳态微聚束加速器光源）、华为和英伟达显卡的对比以及赋能生成式AI和LLM大模型负载L40S服务器。

2023-10-13 16:26:24

927

4090显卡全面下架 AI芯片出口管制趋严

4090显卡全面下架 AI芯片出口管制趋严英伟达民用消费级的高端显卡4090在各个网上店铺都显示无货，有网友吐槽没有想到就是玩个网络游戏，这也被美国制裁了。 4090显卡全面下架是因为美国阻止英伟

2023-10-19 17:24:32

1513

AI芯片，国产发展如何了？

gigaflops芯片都会禁止，同时，英伟达A100/A800/H800/H800/L40/L40S/RTX4090、英特尔Gaudi 2、AMD计划的中国版GPU等特供版AI芯片的供应；先进芯片

2023-10-20 08:43:51

1181

英伟达确认为中国推三款改良AI芯片性能暴降80%

据报道，nvidia的3种ai芯片不是“改良版”，而是“缩水版”，分别是hgx h20、l20 pcle和l2 pcle。用于ai模型训练的hgx h20虽然带宽和计算速度有限，但整体计算能力理论上比英伟达h100 gpu芯片低80%左右。

2023-11-13 10:46:07

418

英伟达推出新款AI芯片H200 性能飙升90%但是估计依然被出口管制

生成式AI火爆全球之后，英伟达的AI芯片一张难求，就在英伟达重量级选手H100 AI芯片目前依然是一货难求的情况下，英伟达推出新款AI芯片H200。 H100目前算是算力市场硬通货，而H200则更强

2023-11-14 16:45:50

956

英伟达真是赢麻了！深夜推出最强AI芯片霸场！

10月14日凌晨，英伟达在2023年全球超算大会（Supercomputing Conference，SC）上正式宣布，升级旗舰AI芯片，推出全新的H200芯片，以处理更强大的人工智能系统。包括

2023-11-16 11:27:59

310

腾讯：已储备足够英伟达芯片！

刘炽平表示，腾讯已经储备足够的英伟达芯片，可以继续开发名为“混元”的人工智能模型，“至少再持续几代”。因此，新的芯片限制短期内不会影响腾讯AI能力的发展。

2023-11-22 17:00:15

325

英伟达“阉割版”AI芯片遇阻，推迟至明年发布

近日，英伟达（Nvidia）为遵守美国出口规定而推迟在中国市场推出的新款人工智能（AI）芯片引起了业界广泛关注。

2023-11-28 14:20:52

478

英伟达扩大台积电投片，满足AI处理器需求

虽然美方的出口限制对英伟达的AI芯片销售造成困扰，但英伟达仍然依靠于各大核心客户如微软、Meta、谷歌、AWS、甲骨文和CoreWeave等强大的AI芯片需求市场。

2023-12-15 09:38:09

246

英伟达与中国市场的博弈英伟达特供芯片遇冷

英伟达在面临美国新规的挑战时，迅速为中国市场开发了特供版AI芯片，旨在满足中国对尖端人工智能技术的需求。

2024-01-08 17:07:10

596

英伟达：AI计算的领导者与市场前景展望

英伟达在全球AI芯片市场中的份额一直处于领先地位。有数据显示，英伟达在中国AI芯片市场的规模预计在2023年将达到110亿美元，并且占据了该市场90%的份额。

2024-01-10 10:04:22

349

印度Yotta公司拟斥资10亿购买英伟达AI芯片

值得注意的是，鉴于美国的相关限制，英伟达在向中国及其他部分市场供应部分芯片时遇到了困难。为此，2023年9月，英伟达成功牵手印度信实工业集团及塔塔集团，共同发展云基础设施、研发语言模型及应用生成性AI技术。

2024-01-12 10:27:56

341

印度厂商Yotta采购10亿美元英伟达AI芯片

印度数据中心运营商Yotta近日宣布，计划从合作伙伴英伟达（Nvidia）额外订购价值5亿美元的AI芯片，使得订单总额达到10亿美元。这一合作将进一步推动Yotta在AI云端服务领域的业务发展。

2024-01-12 15:09:44

537

英特尔推出汽车版AI芯片，与高通、英伟达展开竞争

在2024年的国际消费电子展（CES）上，英特尔正式发布了一款专为汽车领域设计的人工智能（AI）芯片。这一创新产品标志着英特尔正式进军车载AI市场，与高通和英伟达等强劲对手展开正面竞争。

2024-01-15 15:43:55

334

英伟达DRIVE Thor超级芯片首搭极氪新车

英伟达和极氪汽车宣布了一项令人振奋的合作，新款极氪电动汽车将全球首发搭载英伟达DRIVE Thor超级芯片。这款新车预计将在2025年正式上市，而DRIVE Thor超级芯片将为其带来前所未有的AI功能。

2024-01-25 17:25:42

666

英伟达涉足定制芯片，聚焦云计算与AI市场

　作为全球高端AI芯片市场80%份额的霸主，英伟达自2023以来股价上涨超过两倍，2024年市值高达1.73万亿美元。知名公司如微软、OpenAI、Meta纷纷采购英伟达高端AI芯片，以保持其在迅猛发展的AI行业中的领先地位

2024-02-18 11:08:31

222

英伟达再为中国市场特供两款新型AI芯片样品

在全球科技舞台上，英伟达一直以其领先的AI芯片技术备受瞩目。然而，在美国政府的出口限制之下，英伟达为确保在中国市场的地位，不得不推出性能较低但符合出口管制规定的AI芯片。尽管这一策略在美国备受争议，但英伟达似乎并未放弃中国市场。

2024-02-25 11:21:06

445

“网红”芯片Groq让英伟达蒸发5600亿

鉴于ChatGPT的广泛应用，引发了AI算力需求的迅猛增长，使得英伟达的AI芯片供不应求，出现大规模短缺。如今，英伟达似乎在面对更多挑战。

2024-02-27 15:10:55

372

英伟达要小心了！爆火的Groq芯片能翻盘吗？AI推理速度「吊打」英伟达？

随着科技的飞速发展，人工智能公司Groq挑战了英伟达的王者地位，其AI芯片不仅展现出卓越的实力，还拥有巨大的潜力。Groq设计了一种独特的推理代币经济学模式，该模式背后牵动着众多因素，却也引发了深度

2024-03-08 09:44:52

263

英伟达最新AI芯片售价将超3万美元

英伟达最新AI芯片Blackwell的售价引发了业界的广泛关注。据公司创始人黄仁勋透露，这款芯片的售价预计将在3万美元至4万美元之间。这一价格定位不仅彰显了英伟达在AI芯片领域的强大实力，更凸显了公司对于技术创新的执着追求。

2024-03-21 10:50:01

221

已全部加载完成

搜索历史

全面解读英伟达AI芯片发展蓝图

评论