继英特尔发布全新一代AI加速芯片Gaudi 3后,近日宣布将专为中国市场推出特别版本—HL-328及HL-388两款硬件产品。这两款硬件均兼容OAM相容夹层卡与PCle加速卡两种形式。
据官方透露,Gaudi 3的白皮书中详细描述了这两款硬件的上市时间表,分别是6月24日的HL-328以及9月24日的HL-388。
在硬件规格方面,中国版Gaudi 3与原版保持一致,同样具备96MB SRAM片上存储、128GB HBM2e高带宽存储,带宽高达3.7TB/s,并配备PCIe 5.0 x16接口和解码标准。然而,受美国对AI芯片出口管制规定影响,该款芯片的综合运算性能(TPP)需控制在4800以下方可出口至中国,这意味着中国版Gaudi 3的16位性能不得超过150 TFLOPS。
据英特尔数据显示,Gaudi 3在FP16/BF16计算模式下可实现1835 TFLOPS,较之英伟达H100在大模型训练速度提升40%,推理效率提高50%。
显而易见,为了符合出口规定,中国版Gaudi 3必须大幅度降低AI性能。为此,中国版Gaudi 3可能会减少核心数量(原版包含8个矩阵数学引擎和64个张量内核)和降低工作频率。
-
英特尔
+关注
关注
60文章
9875浏览量
171374 -
存储
+关注
关注
13文章
4245浏览量
85623 -
sram
+关注
关注
6文章
762浏览量
114607
发布评论请先 登录
相关推荐
评论