AMD首席执行官苏姿丰出席imec ITF World 2024大会并荣获创新奖,此项荣誉旨在肯定其卓越创新及引领行业发展之贡献。先前同样获得该奖项的还有戈登·摩尔和比尔·盖茨。
会议期间,苏姿丰谈论了AMD如何通过实施30x25战略推动2025年计算节点能效提升30倍的目标。她进一步透露,AMD已找到2026年至2027年间将能效提升100倍以上的解决方案。
随着生成式AI LLM如ChatGPT的崛起,AI功耗问题日益凸显。AMD早在2021年便洞察到AI庞大功耗需求所引发的挑战,并以此为契机启动30x25战略,致力于提升数据中心计算节点能效,尤其针对AI和HPC的高能耗问题。
随着训练模型所需算力不断攀升,AI功耗问题愈发严峻。苏姿丰指出,早期图像和语音识别AI模型体积每两年翻番,与过去十年计算能力提升速度相当。然而,生成式AI模型规模现今正以每年20倍的速度扩张,远超计算和存储进步速度。尽管当前最大模型需借助数万个GPU进行训练,耗费数万兆瓦时电力,但未来模型规模迅速扩大后,或需动用数十万个GPU,甚至数吉瓦时电力进行训练。
为了提升能效,AMD采取了全方位策略,涵盖硅架构升级、先进封装策略、AI专用架构设计、系统及数据中心级调整,以及软硬件协同设计等多个层面。
硅材料无疑是基础。苏姿丰强调,AMD正在推进3nm GAA晶体管研发,旨在提升功率效率和性能,同时持续关注先进封装和互联技术,以实现更高效、经济的模块化设计。先进封装在突破单芯片封装性能瓶颈方面具有重要意义,AMD采用2.5D和3D封装混合技术,最大化每平方毫米数据中心硅片的计算能力。
在服务器节点与服务器机架间传输数据因距离过长导致额外电力消耗,优化数据局部性可大幅节约能源。AMD MI300X展示了大规模芯片封装所带来的效率优势——该芯片包含1530亿个晶体管,分布在12个芯片上,配备24个HBM3芯片,提供192GB存储容量,均可作为本地内存供GPU使用。此外,封装内单元间经功率和性能优化的Infinity Fabric互连,使得极高的计算和存储密度能够将更多数据保存在接近处理核心的位置,从而降低数据传输所需能量。
-
amd
+关注
关注
25文章
5429浏览量
133868 -
gpu
+关注
关注
28文章
4685浏览量
128646 -
HPC
+关注
关注
0文章
309浏览量
23667 -
生成式AI
+关注
关注
0文章
481浏览量
452
发布评论请先 登录
相关推荐
评论