电子发烧友网报道(文/周凯扬)AMD在不久前发布了Instinct MI300,一个结合了CDNA3和Zen4架构的产品系列,比如率先公布的产品为128GB的MI300A。然而在这之后,AMD针对大语言模型市场,专门推出了纯CDNA 3 GPU架构打造的MI300X,集成192GB的HBM3。
下一代数据中心与超算的选择,Instinct MI300
随着英伟达的A100、H100等GPU产品在今年经历大热、缺货和涨价,越来越多的厂商开始做两手准备,开始寻找替代品。在AI与HPC领域,市面上缺乏能与英伟达旗舰产品竞争的高性能成熟方案。
虽然相较其他厂商而言,谷歌已经凭借其TPU和OCS在同类负载中实现了不错的性能/TCO表现,但总的来说依然限制在了单个公司的单个云服务上,也很难给到厂商去提前评估的空间,所以并不算一个完善的第三方解决方案。
为此,AMD推出了MI300X,一个纯粹的生成式AI加速器方案,内存带宽达到了可怕的5.2TB/s。与英伟达的H100 SXM 80GB相比,MI300X带宽提升了72%,容量根据版本差异有了60%或140%的提升。
基于MI300X,AMD打造了一个名为无限架构的平台,将8块Instinct MI300X互联在一起,实现1.5TB的HBM3内存。这与英伟达的8路HGX板和英特尔的8路Ponte Vecchio一样,看来未来高端服务器都会采用这套8路处理器的配置。
目前MI300A早已送样,而MI300X也已经在Q3送样,相信明年起,我们就能在HPC和AI服务器上看到两块芯片的身影了。但这也注定了MI300系列更像是一次略显仓促的反击,AMD真正的王牌,可能还是未来的Instinct MI400。
集3D/2.5D混合计算大成的Instinct MI400
在今年AMD的Q2财报会议上,AMD CEO苏姿丰提到:“从这些工作负载和我们投资的技术来看,不只是现有产品,还有下一代MI400系列等,我们打造了一个极具竞争力且性能满足需求的硬件路线图。坦白说,大家讨论到AMD往往都会提到软件路线图,我们也都看到了软件侧的一些改变。”
近期举办的DARPA ERI峰会上,AMD CTO Mark Papermaster也对MI400进行了一个小小的预告,它表示Instinct MI400将成为3D/2.5D混合计算集大成之作。从收购Xilinx以来,AMD已经对其整体产品的封装和互联方案进行了大刀阔斧的改革,充分结合两家厂商在这方面的深入研究。
AMD Chiplet与封装进化路线图 / AMD
AMD将其称为一个全面化的设计,从芯片堆叠、封装、计算、内存、加速器、互联、软件栈和应用等方面进行系统级的优化,采用特定域的异构架构,深度集成处理器、封装与互联技术,且在所有层面都充分利用AI。
但上文也都反复提及了软件,这是AMD不得不去解决的一个问题。虽然AMD提供了一个简易的CUDA移植路径,但正如联想HPC与AI部门总经理Scott Tease所说的那样,还达不到一站式解决方案的程度。
写在最后
AMD作为与英伟达在消费图形领域竞争多年的对手,如今同样发力服务器与AI领域,势必也会带来新的市场格局。只要MI400在性能表现上达到预期,且发布时和发布后AMD能做好软件生态的构建,都可能会对英伟达的主导地位造成一定威胁。不过考虑到发布时间,届时AMD的MI400面对的可能是首次用上MCM封装的Blackwell GB100 GPU。
-
amd
+关注
关注
25文章
5466浏览量
134088 -
英伟达
+关注
关注
22文章
3770浏览量
90985
发布评论请先 登录
相关推荐
评论