0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔Gaudi 3 AI芯片:5nm工艺设计,训练推理皆强

微云疏影 来源:综合整理 作者:综合整理 2024-04-10 11:10 次阅读

4 月 9 日,英特尔在 Vision 2024 大会上公布最新一代 Gaudi 3 AI 芯片并宣布将于同年第三季度批量上市。相较于英伟达 H100,Gaudi 3 训练性能提升 170%,推理能力增幅 50%,效率提升 40%,而成本显著降低。

此外,英特尔在发布会上还宣布更改旗下数据中心CPU产品名称:原“Granite Rapids”和“Sierra Forest”将更名为“Xeon 6”系列。新品预计今年发售,并支持性能提升后的标准化 MXFP4 数据格式。

除此之外,英特尔正研发适用于以太网的 AI NIC ASIC 及 AI NIC 小芯片。这两款产品尤其适合于其未来的 XPU 和 Gaudi 3 处理器,有望通过英特尔代工厂对外销售。有关网络产品的详细信息尚未公开。

据悉,Gaudi 3 采用 5nm 制程,FP8性能较前代翻番,BF16性能增大至四倍,网络带宽增加一倍,内存带宽扩大约 1.5 倍,能够提供Mezz卡、板载以及PCIe三种形式。

Gaudi 3拥有64个第五代张量处理核心和8个矩阵计算引擎,并配备128GBHBM内存和96MBSRAM。设计有24条200GBERoCE标准以太网总线和最多16条PCIe5.0总线。

在板载版,聚类产品型号为HLB-325。由八块Gaudi 3 Mezz卡组成的模块提供约14.6PFLOPS的FP8性能,极大的带宽速率达29.6TB/s的HBM2e内存,64个线性计算引擎,192条200GBE网络总线和上述所有。

在PCIe版本,型号为HL-338的卡具有单卡达1835TFLOPS的FP8峰值性能,128GBHBM2e内存,8个线性计算引擎,24条200GBE网络总线,功率消耗600W,占两卡槽的整体空间高度。

一个由8个Gaudi 3 AI加速器构成的节点可提供14.7PF FP8计算性能,128GB的内存,8.4TB/s的网络读写速度,而64个节点的集群(512个AI加速器)能提供的最大计算性能为7.52EF FP8,525.3TB的内存和614TB/s的网络读写速度。更高的,1024个节点的集群可以达到15EF FP8的计算性能,1PB的内存和1,229PB每秒的网络读写速度。

在实际测试中,与英伟达的主流产品H100比较,Gaudi 3在相同节点数时的平均训练时间要高出约1.7倍,LLAMA2 70亿的模型参数的情况下超过了H100的1.5倍,对于LLAMA2 130亿参数的模型,Gaudi 3在最高时也超过了H100的1.7倍,同样,GPT 3已达到1750亿参数,且Gaudi 3在推理速度和能效表现上均优

英特尔近日发布了其下一代 GPU 路线规划——Gaudi 3,包括风冷和液冷版本,计划于明年三至四季度相继批量交付。Gaudi 3 由戴尔、惠普、联想及超微等众多合作伙伴负责生产和销售,据称下半年有望登陆英特尔自家的云服务——Developer Cloud。除了 Gaudi 3,英特尔还向我们展示了公司在各层面的 AI 产品线的最新进展。

为了更好地优化 AI 的表现,英特尔发布了全新的 Xeon 6 处理器,主要用于大模型的训练。Xeon 6 采用了高效能的 E-core 核心和高性能的 P-core 核心,其中 E-core 核心代号为 Sierra Forest,能效较前一代提升了整整两倍半,而 P-core 则代号为 Granite Rapids,支持 MXFP4。值得一提的是,比起前一代 Xeon 处理器,Xeon 6 的机身架构扩展了整整 2.7 倍,已经开始被许多用户用来升级老旧设备,以此达到节能减排的目的。

值得一提的还有物联网的应用。今年,英特尔预计将共售出超过 4000 万台基于酷睿 Ultra 处理器的 AI PC,除了消费级市场,AI 也正逐渐走进人们生活的方方面面,如工业制造、医疗健康等领域。据悉,该公司将于年内发布一系列新的边缘芯片,这些产品将涵盖酷睿 Ultra、酷睿、凌动处理器和 Arc GPU,旨在覆盖多个不同行业的应用需求。

另外,英特尔还透露计划此次与Ultra Ethernet Consortium合作,推出一种名为 AI Ethernet 的网络解决方案,专门解决海量数据迁移中的网络拥堵问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    9967

    浏览量

    171789
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10863

    浏览量

    211788
  • 数据中心
    +关注

    关注

    16

    文章

    4779

    浏览量

    72131
收藏 人收藏

    评论

    相关推荐

    使用英特尔AI PC为YOLO模型训练加速

    之后,情况有了新的变化,PyTorch2.5正式开始支持英特尔显卡,也就是说,此后我们能够借助英特尔 锐炫 显卡来进行模型训练了。
    的头像 发表于 12-09 16:14 298次阅读
    使用<b class='flag-5'>英特尔</b><b class='flag-5'>AI</b> PC为YOLO模型<b class='flag-5'>训练</b>加速

    英特尔发布全新企业AI一体化方案

    近日,英特尔正式推出了全新的企业AI一体化方案。该方案以英特尔至强处理器和英特尔Gaudi 2D AI
    的头像 发表于 12-03 11:20 231次阅读

    Inflection AI转向英特尔Gaudi 3,放弃英伟达GPU

    近日,人工智能技术公司Inflection AI宣布了一项重要决策,其最新的企业平台将放弃采用英伟达(Nvidia)的GPU,转而选择英特尔Gaudi 3加速器。
    的头像 发表于 10-10 17:21 492次阅读

    Inflection AI携手英特尔推出企业级AI系统

    近日,AI初创企业Inflection AI英特尔联合宣布了一项重大合作——推出基于英特尔Gaudi
    的头像 发表于 10-09 16:40 448次阅读

    英特尔调降明年AI服务器芯片出货目标

    近日,有消息称英特尔为应对内部策略调整及终端需求变化,已对其旗下AI服务器芯片Gaudi 3的明年出货目标进行了大幅调整。
    的头像 发表于 10-08 15:38 281次阅读

    英特尔发布Gaudi3 AI加速器,押注低成本优势挑战市场

    英特尔近期震撼发布了专为AI工作负载设计的Gaudi3加速器,这款新芯片虽在速度上不及英伟达热门型号H100与H200 GPU,但英特尔巧妙
    的头像 发表于 09-26 16:16 825次阅读

    IBM Cloud将部署英特尔Gaudi 3 AI芯片

    近日,科技巨头IBM与英特尔宣布了一项重大合作计划,双方将共同在IBM Cloud平台上部署英特尔最新的Gaudi 3 AI
    的头像 发表于 09-03 15:52 391次阅读

    英特尔3nm制程工艺“Intel 3”投入大批量生产

    据外媒最新报道,全球知名的处理器大厂英特尔在周三宣布了一个重要的里程碑:其先进的3nm级制程工艺技术“Intel 3”已在两个工厂正式投入大批量生产。这一技术的突破,无疑将为
    的头像 发表于 06-21 09:31 534次阅读

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智化供应链

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智化供应链
    的头像 发表于 05-27 11:50 543次阅读
    <b class='flag-5'>英特尔</b>助力京东云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型构建数智化供应链

    英特尔特供芯片性能暴降92%!

    英特尔针对中国市场推出的特供版Gaudi 3芯片在性能上确实存在大幅下降的情况,这主要是由于美国对于AI
    的头像 发表于 04-17 16:57 813次阅读

    英特尔拟推出中国市场“特供版芯片Gaudi 3

    英特尔计划在中国市场推出“特供版”Gaudi 3 AI芯片,这一决策主要是基于美国对于AI
    的头像 发表于 04-16 14:48 575次阅读

    英特尔的最强AI芯片要来了,声称性能完胜英伟达H100

    美国东部时间4月9日凌晨,英特尔发布了其最新的人工智能芯片Gaudi3,预计将在第三季度大范围上市。 在当天举办的Intel Vision 2024大会上,英特尔CEO帕特·基辛格(P
    的头像 发表于 04-11 23:36 469次阅读

    英特尔进军AI芯片市场:推出Gaudi 3 AI加速卡与Xeon 6处理器

    Gaudi 3作为英特尔AI领域的最新力作,旨在与英伟达等市场领导者展开竞争。据英特尔透露,这款芯片
    的头像 发表于 04-10 15:37 795次阅读

    英特尔发布人工智能芯片新版,对标Nvidia

    为应对AI行业对高性能芯片的巨大需求,英特尔推出了全新Gaudi 3芯片,据称这一款
    的头像 发表于 04-10 09:26 368次阅读

    台积电扩增3nm产能,部分5nm产能转向该节点

    目前,苹果、高通、联发科等世界知名厂商已与台积电能达成紧密合作,预示台积电将继续增加 5nm产能至该节点以满足客户需求,这标志着其在3nm制程领域已经超越竞争对手三星及英特尔
    的头像 发表于 03-19 14:09 658次阅读