英伟达原本预定2023年发布涵盖HGX H20、L20、L2等型号的AI计算GPU产品,但受制于美国商务部同年10月更新后的出口管制政策扩大对华限制,影响到了这些新品的如期面世。
据之前所披露的详细数据,英伟达HGX H20虽属与H100和H200同系列,共享英伟达Hopper架构,但拥有高达96GB的HBM3显存及4.0TB/s的显存带宽,计效包括FP8达到296TFLOPS和FP16高达148TFLOPS。其能力仅比当前被誉为“最强者”的AI芯片H200低1/13。
通观HGT H20特性,其优势在于支持超快速NVLink 900GB/s链接并采用SXM板卡形式,以匹配英伟达8路HGX服务器规格。从技术指标出发,它的表现达到并满足了美国出口规定。
另两款产品L20与L2同样采用了PCIe 4.0 x16的板卡形式并且内置英伟达Ada Lovelace架构。它们配备了48GB与24GB的GDDR6显存,尽管计算性能不及H20,但也足以应对大部分需求。
在美方出口管制政策落地之后,英伟达选择首先在中国撤回RTX 4090游戏显卡,然后采取举措,即推出更精简的RTX 4090 D版本,以适应中国市场特定需要,减少了CUDA核心数量至14592个,这一改变导致性能大约下降了10%。
据分析师郭明錤在2023年12月28日的文章中透漏,英伟达规划在2024年第二季度启动H20 AI GPU芯片的大规模生产,其中纬创将作为唯一制造商负责相关基板供应。
-
架构
+关注
关注
1文章
513浏览量
25468 -
英伟达
+关注
关注
22文章
3767浏览量
90973 -
HBM
+关注
关注
0文章
378浏览量
14740
发布评论请先 登录
相关推荐
评论