电子发烧友网报道(文/周凯扬)在今年的AWS re:Invent上,云服务巨头亚马逊公开了两款全新的自研芯片,一是基于Arm架构的新一代Gravition CPU,Gravition4,另一款则是时隔数年终于更新的Trainium2。
第四代自研Arm服务器CPU
从2018年11月,到今年的11月,Gravition这一亚马逊自研的服务器CPU已经迭代了数个版本,Gravition4作为该系列最新的产品,自然也拥有最强大的性能表现。Gravition4集成了96个Arm Neoverse V2内核,每个内核配置了2MB的L2缓存,加上12个DDR5-5600通道。相比上一代,Gravition4的核心数多出了50%,计算性能提高了30%,L2缓存变为两倍,内存带宽也提高了75%,可以毫无疑问地说,Gravition4将成为AWS自研硬件服务器矩阵的新王牌。
不过AWS计算与网络服务副总裁David Brown表示,跑分与现实应用负载相去甚远,往往不能代表芯片的真实性能表现,所以亚马逊更愿意用实际应用的成绩来展示Gravition4的性能提升。在MySQL这样的数据库应用中,Gravition4展现出了高出Gravition3 40%的性能。在网页应用上,Gravition4比上一代快30%,在大型Java应用中快45%。
而且毫不夸张地说,Gravition4也是目前对 ML硬件支持最为完善的CPU了。除了自研的Inferentia和Trainium系列芯片以外,亚马逊也为Gravition4组合打造了支持英伟达A100、H100、英特尔Habana Gaudi、高通AI100的容器。
训练芯片终于迎来第二代
在去年的AWS re:Invent上,亚马逊公开了全新的Inferentia2芯片,这也是其自研AI芯片矩阵中的推理芯片,但其训练芯片Trainium却没有同步更新,直到今年的AWS re:Invent上Trainium2的发布,才终于为这个3年前开辟的产品线带来了新品。
如今爆发式的生成式AI应用需要利用庞大的数据集进行训练,比如最近兴起的静态图片生成视频应用。这些基础模型或大语言模型的参数从千亿到万亿不等,需要更高的算力才能支撑起来。
更高的性能也是Trainium2本次升级的重点,根据亚马逊提供的数据,相较于第一代Trainium芯片,Trainium2提供了4倍的训练性能和3倍的内存容量,与此同时还将能效比提高至上一代的两倍。在扩展性上,亚马逊最高可提供 10万颗Trainium2芯片互联,从而实现高达65 exaflops的算力,提供超算级的性能。在这样的规模下,训练一个3000亿参数的LLM只要数周时间。
不过,与已经进入预先使用阶段且未来几个月就将开放使用的Gravition4不同,Trainium2应该仍在量产过程中,亚马逊表示明年某个时间才会投入使用。
写在最后
从亚马逊雷打不动的发布频率来看,他们在自研服务器芯片的设计上相当积极,多次首发Arm Neoverse的最新核心。而且从服务器部署情况来看,他们也没有在量产上遇到太多的问题,几乎可以推测除了英伟达以外,亚马逊应该就是台积电先进封装的最大使用者了。此外,亚马逊对待第三方硬件的策略也相当聪明,亚马逊并没有选择去追求极致的性能,而是借助自研芯片打造更具性价比的方案。
-
亚马逊
+关注
关注
8文章
2624浏览量
83168
发布评论请先 登录
相关推荐
评论