AMD不止一次表示:Zen奠定了AMD未来几年产品的路线图,现如今,“Zen”这把火已经在CPU市场越烧越旺。
对比CPU架构Zen,AMD的GPU 架构则显得没有那么亮眼,曾经的“GCN”已经慢慢退出历史舞台,而AMD在GPU领域的新一轮布局才刚刚开始。去年,AMD推出了为游戏所设计的专用图形架构RDNA;今年,AMD则推出了专门为高性能计算所打造CDNA架构,并且在近期发布了首款基于全新CDNA架构的Instinct MI100加速显卡。
众所周知,AMD是世界上唯一一家在CPU跟GPU上都做到行业标杆的企业,在高性能计算领域,AMD的CPU与GPU的产品组合又会给客户带来哪些惊喜呢?
AMD高级副总裁兼服务器业务总经理Dan McNamara表示,在高性能计算方面,整个行业发展十分迅速。我们看到的趋势是,工作负载的多样性在不断增加,高性能计算已经进入到很多领域,包括从传统科研,气象研究,生命科学,电子设计自动化到商业应用,从AI、机器学习到算法培训等等,如何通过CPU和GPU方面的组合更好地服务于客户、为客户带来更多单位成本性能和减少总体拥有成本,将是AMD极其重要的战略之一。
CDNA架构Instinct MI100加速显卡 逼近百亿亿次级计算时代
在整个过去20年里,整个高性能计算经历了三个阶段,分别是TERASCALE、PETASCALE和现在的EXASCALE。在这个过程中我们需要一系列技术来支持EXASCALE这样一个百亿亿次级计算。
AMD平台解决方案工程研发全球副总裁Brad Mccredie表示,(如上图所示)我们可以看到接近EXASCALE的时候,所需性能速度是放慢的趋势,没有办法用很快的速度达到百亿亿次级的发展。基于此,AMD推出了CDNA架构Instinct MI100加速显卡,这款GPU产品能够实现10TF(十万亿次双精度计算速度),具备Matrix核心技术,它能够进一步逼近百亿亿次级的运算时代。
与AMD上一代产品相比有着巨大的性能提升,AMD Instinct MI100能够实现高达70%的AI计算加强;而与竞争对手相比,在每单位性能上也是对方的两倍。特别是在搭配第二代AMD EPYC处理器使用时,还可为系统提供更强的加速性能。
以AMD Instinct MI100为例,CDNA架构可在同一晶片上放入了两倍数量的计算单元,并可以嵌入微架构以更好的适应AI和高性能计算的工作负载。同时在16位浮点计算和混合精度计算方面也能实现7倍以上的性能提升,另外通过Infinity架构还可以将GPU的带宽提升4倍、通过HBM2内存来实现20%的位宽提升。
据Brad Mccredie介绍,AMD与4家顶级系统厂商在密切配合,将于本月开始陆续发货。
开源软件站ROCm 4.0 为百亿亿次级计算提供了新基础
世界级硬件(AMD Instinct MI100),也需要世界级生态来做配套,AMD推出了开源软件站ROCm 4.0。该平台不仅相较上两代产品,可实现MI100高达5-8倍的性能提升,还可为开发者们提供简单快捷的代码迁移功能,甚至最短1天就可完成某些代码的迁移工作。
Brad Mccredie表示,它(开源软件站ROCm 4.0)是一套不断壮大的生态系统,从功能上来说也非常完善,已经做好了企业级客户的部署就绪,为百亿亿次级计算提供了新基础。
AMD Instinct MI100落地应用 还有与霄龙的搭配组合
AMD分享了一系列AMD Instinct MI100落地应用。据介绍,橡树岭国家实验室就通过使用MI100来进行相关工作负载,在分子动力学负载中,与v100加速显卡相比速度提升3倍。而在Fluid Turbulence的工作负载中,也比v100加速显卡有2.6倍的速度优势。
Dan McNamara补充了CGG以及ECMWF的应用,CGG是一家地球科学公司,他们使用霄龙CPU和MI100 GPU来帮助他们做地震成效以及更好的决策。在气象建模方面,欧洲的ECMWF利用霄龙处理器打造世界最强的气象建模的超算之一。他表示,AMD近期有很多客户成功案例,也显示了霄龙处理器和AMD GPU产品在整个高性能计算市场的巨大成功。
打造出伟大的产品——这是苏姿丰博士在上任之初为AMD规划出的未来战略之一,AMD也一直朝着既定的目标前进,在企业级市场,不管是CPU(霄龙)还是GPU(MI100),AMD都拿出了让客户满意的产品。AMD也一直践踏实地,用产品赢得客户的心,这才是AMD的制胜之道。
责任编辑:xj
-
amd
+关注
关注
25文章
5415浏览量
133779 -
cpu
+关注
关注
68文章
10798浏览量
210706 -
显卡
+关注
关注
16文章
2415浏览量
67361
发布评论请先 登录
相关推荐
评论