英特尔Gaudi 3 AI芯片：5nm工艺设计，训练推理皆强-电子发烧友网

4 月 9 日，英特尔在 Vision 2024 大会上公布最新一代 Gaudi 3 AI 芯片并宣布将于同年第三季度批量上市。相较于英伟达 H100，Gaudi 3 训练性能提升 170%，推理能力增幅 50%，效率提升 40%，而成本显著降低。

此外，英特尔在发布会上还宣布更改旗下数据中心 CPU 产品名称：原“Granite Rapids”和“Sierra Forest”将更名为“Xeon 6”系列。新品预计今年发售，并支持性能提升后的标准化 MXFP4 数据格式。

除此之外，英特尔正研发适用于以太网的 AI NIC ASIC 及 AI NIC 小芯片。这两款产品尤其适合于其未来的 XPU 和 Gaudi 3 处理器，有望通过英特尔代工厂对外销售。有关网络产品的详细信息尚未公开。

据悉，Gaudi 3 采用 5nm 制程，FP8性能较前代翻番，BF16性能增大至四倍，网络带宽增加一倍，内存带宽扩大约 1.5 倍，能够提供Mezz卡、板载以及PCIe三种形式。

Gaudi 3拥有64个第五代张量处理核心和8个矩阵计算引擎，并配备128GBHBM内存和96MBSRAM。设计有24条200GBERoCE标准以太网总线和最多16条PCIe5.0总线。

在板载版，聚类产品型号为HLB-325。由八块Gaudi 3 Mezz卡组成的模块提供约14.6PFLOPS的FP8性能，极大的带宽速率达29.6TB/s的HBM2e内存，64个线性计算引擎，192条200GBE网络总线和上述所有。

在PCIe版本，型号为HL-338的卡具有单卡达1835TFLOPS的FP8峰值性能，128GBHBM2e内存，8个线性计算引擎，24条200GBE网络总线，功率消耗600W，占两卡槽的整体空间高度。

一个由8个Gaudi 3 AI加速器构成的节点可提供14.7PF FP8计算性能，128GB的内存，8.4TB/s的网络读写速度，而64个节点的集群（512个AI加速器）能提供的最大计算性能为7.52EF FP8，525.3TB的内存和614TB/s的网络读写速度。更高的，1024个节点的集群可以达到15EF FP8的计算性能，1PB的内存和1，229PB每秒的网络读写速度。

在实际测试中，与英伟达的主流产品H100比较，Gaudi 3在相同节点数时的平均训练时间要高出约1.7倍，LLAMA2 70亿的模型参数的情况下超过了H100的1.5倍，对于LLAMA2 130亿参数的模型，Gaudi 3在最高时也超过了H100的1.7倍，同样，GPT 3已达到1750亿参数，且Gaudi 3在推理速度和能效表现上均优

英特尔近日发布了其下一代 GPU 路线规划——Gaudi 3，包括风冷和液冷版本，计划于明年三至四季度相继批量交付。Gaudi 3 由戴尔、惠普、联想及超微等众多合作伙伴负责生产和销售，据称下半年有望登陆英特尔自家的云服务——Developer Cloud。除了 Gaudi 3，英特尔还向我们展示了公司在各层面的 AI 产品线的最新进展。

为了更好地优化 AI 的表现，英特尔发布了全新的 Xeon 6 处理器，主要用于大模型的训练。Xeon 6 采用了高效能的 E-core 核心和高性能的 P-core 核心，其中 E-core 核心代号为 Sierra Forest，能效较前一代提升了整整两倍半，而 P-core 则代号为 Granite Rapids，支持 MXFP4。值得一提的是，比起前一代 Xeon 处理器，Xeon 6 的机身架构扩展了整整 2.7 倍，已经开始被许多用户用来升级老旧设备，以此达到节能减排的目的。

值得一提的还有物联网的应用。今年，英特尔预计将共售出超过 4000 万台基于酷睿 Ultra 处理器的 AI PC，除了消费级市场，AI 也正逐渐走进人们生活的方方面面，如工业制造、医疗健康等领域。据悉，该公司将于年内发布一系列新的边缘芯片，这些产品将涵盖酷睿 Ultra、酷睿、凌动处理器和 Arc GPU，旨在覆盖多个不同行业的应用需求。

另外，英特尔还透露计划此次与Ultra Ethernet Consortium合作，推出一种名为 AI Ethernet 的网络解决方案，专门解决海量数据迁移中的网络拥堵问题。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英特尔

英特尔

+关注

关注
61

文章
10049

浏览量
172749
cpu

cpu

+关注

关注
68

文章
10936

浏览量
213677
数据中心

数据中心

+关注

关注
16

文章
4935

浏览量
72577

英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

Pro模型进行了深度优化。这一优化举措使得AI开发者能够以更低的成本和更高的效率实现复杂任务的部署与优化。英特尔Gaudi 2D AI加速器通过其卓越的计算能力和高度优化的软件栈，

发表于 02-10 11:10 •297次阅读

DeepSeek发布Janus Pro模型，英特尔Gaudi 2D AI加速器优化支持

Gaudi 2D AI加速器现已针对该模型进行了全面优化。这一优化举措使得AI开发者能够更轻松地实现复杂任务的部署与优化，从而有效满足行业应用对于推理算力的迫切需求。

发表于 02-08 14:35 •314次阅读

英特尔发布全新企业AI一体化方案

近日，英特尔正式推出了全新的企业AI一体化方案。该方案以英特尔至强处理器和英特尔Gaudi 2D AI

发表于 12-03 11:20 •321次阅读

Inflection AI转向英特尔Gaudi 3，放弃英伟达GPU

近日，人工智能技术公司Inflection AI宣布了一项重要决策，其最新的企业平台将放弃采用英伟达（Nvidia）的GPU，转而选择英特尔的Gaudi 3加速器。

发表于 10-10 17:21 •558次阅读

Inflection AI携手英特尔推出企业级AI系统

近日，AI初创企业Inflection AI与英特尔联合宣布了一项重大合作——推出基于英特尔Gaudi

发表于 10-09 16:40 •531次阅读

英特尔调降明年AI服务器芯片出货目标

近日，有消息称英特尔为应对内部策略调整及终端需求变化，已对其旗下AI服务器芯片Gaudi 3的明年出货目标进行了大幅调整。

发表于 10-08 15:38 •363次阅读

英特尔发布Gaudi3 AI加速器,押注低成本优势挑战市场

英特尔近期震撼发布了专为AI工作负载设计的Gaudi3加速器，这款新芯片虽在速度上不及英伟达热门型号H100与H200 GPU，但英特尔巧妙

发表于 09-26 16:16 •941次阅读

IBM Cloud将部署英特尔Gaudi 3 AI芯片

近日，科技巨头IBM与英特尔宣布了一项重大合作计划，双方将共同在IBM Cloud平台上部署英特尔最新的Gaudi 3 AI

发表于 09-03 15:52 •450次阅读

英特尔3nm制程工艺“Intel 3”投入大批量生产

据外媒最新报道，全球知名的处理器大厂英特尔在周三宣布了一个重要的里程碑：其先进的3nm级制程工艺技术“Intel 3”已在两个工厂正式投入大批量生产。这一技术的突破，无疑将为

发表于 06-21 09:31 •746次阅读

英特尔助力京东云用CPU加速AI推理，以大模型构建数智化供应链

英特尔助力京东云用CPU加速AI推理，以大模型构建数智化供应链

发表于 05-27 11:50 •638次阅读

英特尔特供芯片性能暴降92%！

英特尔针对中国市场推出的特供版Gaudi 3芯片在性能上确实存在大幅下降的情况，这主要是由于美国对于AI

发表于 04-17 16:57 •906次阅读

英特尔拟推出中国市场“特供版芯片”Gaudi 3

英特尔计划在中国市场推出“特供版”Gaudi 3 AI芯片，这一决策主要是基于美国对于AI

发表于 04-16 14:48 •677次阅读

英特尔的最强AI芯片要来了，声称性能完胜英伟达H100

美国东部时间4月9日凌晨，英特尔发布了其最新的人工智能芯片Gaudi3，预计将在第三季度大范围上市。在当天举办的Intel Vision 2024大会上，英特尔CEO帕特·基辛格（P

发表于 04-11 23:36 •580次阅读

英特尔进军AI芯片市场：推出Gaudi 3 AI加速卡与Xeon 6处理器

Gaudi 3作为英特尔在AI领域的最新力作，旨在与英伟达等市场领导者展开竞争。据英特尔透露，这款芯片

发表于 04-10 15:37 •882次阅读

英特尔发布人工智能芯片新版，对标Nvidia

为应对AI行业对高性能芯片的巨大需求，英特尔推出了全新Gaudi 3芯片，据称这一款

发表于 04-10 09:26 •454次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

英特尔Gaudi 3 AI芯片：5nm工艺设计，训练推理皆强

评论

英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

DeepSeek发布Janus Pro模型，英特尔Gaudi 2D AI加速器优化支持

英特尔发布全新企业AI一体化方案

Inflection AI转向英特尔Gaudi 3，放弃英伟达GPU

Inflection AI携手英特尔推出企业级AI系统

英特尔调降明年AI服务器芯片出货目标

英特尔发布Gaudi3 AI加速器,押注低成本优势挑战市场

IBM Cloud将部署英特尔Gaudi 3 AI芯片

英特尔3nm制程工艺“Intel 3”投入大批量生产

英特尔助力京东云用CPU加速AI推理，以大模型构建数智化供应链

英特尔特供芯片性能暴降92%！

英特尔拟推出中国市场“特供版芯片”Gaudi 3

英特尔的最强AI芯片要来了，声称性能完胜英伟达H100

英特尔进军AI芯片市场：推出Gaudi 3 AI加速卡与Xeon 6处理器

英特尔发布人工智能芯片新版，对标Nvidia