虽然训练 AI 需要超强大的 GPU 算力,但 AI 算法的执行首先需要超高效的芯片。就像 AmpereCPU,未来的 AmpereOne 将拥有不少于256个内核,其功率仅为350W。(原文转自 Adrian Branco 发表于2024年6月10日)
Adrian Branco pour les Numériques - AmpereOne 256
或许你永远无需自己购买处理器,但毫无疑问,你每天都会在不知不觉中使用。Ampere Computing 是一家美国公司,由英特尔前高管 Renée James 创立。Ampere 的使命是设计和销售用于数据中心和超级计算机的基于 ARM 架构的CPU,其最新一代 AmpereOne 不久前刚刚亮相。 这与我们的应用程序和使用有什么关系呢?随着基于云的 AI 助手的不断发展,行业玩家们正在努力寻求降低购买和消费方面的使用费用。在这个游戏中,Ampere 基于ARM 架构的 CPU 具有很多优势。
首先让我们来谈谈芯片:虽然192核5nm版本的 AmpereOne 已经上市,并集成到法国 Scaleway 公司(我们去年12月访问过其后台)等数据中心,但 Ampere 未来的芯片将走得更远。得益于迄今为止苹果芯片独有的3nm工艺,Ampere 能够将内核数量增加33%,将 CPU 核心数量提高到256个。 但是,面对越来越耗电的芯片,英特尔正在积极研发从1KW到2KW的散热芯片,英伟达毫不掩饰自己也在走同样的道路 —— Ampere 正在做战略性的押注,以不断散热的方式寻求性能提升。通过添加越来越多的内核来实现这一点,即创造更加高效的“心”。
恒定功耗下的更多内核
Jeff Wittich, Chief Product Officer at Ampere
根据 Ampere 的路线图,该公司计划于2025年推出的下一代旗舰产品 AmpereOne 将拥有256个内核。但正如 Ampere 首席产品官 Jeff Wittich 所解释的那样,这种芯片与 GPU 和其他高功率加速器相反。“数据中心行业的能源消耗增长速度是不可持续的,你不可能总是消耗更多的电力,你必须尽可能优化消耗。我们在市场上的优势在于,我们设计了一种专门用于云计算的芯片架构。尽管我们的竞争对手拥有云前和 AI 前的核心设计,但我们的 CPU 内核和芯片完全是为满足这一需求而设计的”, Jeff 说。
Ampere 的第一个武器是其芯片中嵌入的内核数量惊人。“目前,我们最密集的芯片有192个 CPU 内核。但到2025年,我们的3nm AmpereOne 将提供不少于256个内核。” 这就是 Ampere 的第二个武器。新芯片的功耗将与当前芯片完全相同,也就是说 “在300W到350W之间”,Jeff解释道,“我们不想消耗更多的能源,我们总是想用同样的功率做更多的事情。Ampere 的架构是可扩展的,特别适合 AI ”。等一下,AI不是 GPU 的领域吗?
85%的AI与训练无关
Victor Jakubiuk, Head of AI at Ampere
面对如今市值达30000亿美元的英伟达,一个小玩家如何撼动这样一个庞然大物呢?Ampere AI 主管 Victor Jakubiuk 解释道:“这不是一回事。强大的 GPU 是用来训练 AI 的。我们谈论的是密集型计算,这需要高性能的芯片。但 AI 训练只占该领域相关计算的15%。剩下的85%用于推理,即使用这些 AI。因为一旦一个模型经过训练,需要数周或数月的时间,它就会被数百万用户大量使用。这就是 Ampere 处理器的用武之地” 。
以最优化的方式运行模型的处理器,它们是什么型号?Jeff Wittich 回答说:“除了 CPU 的经典用途(如MongoDB等数据库)外,我们的 CPU 核心还用于许多日常任务。当您观看视频时,我们的 CPU 负责生成自动字幕并翻译这些字幕。当您在银行应用程序中使用聊天机器人时,我们的 CPU 可能也在运行并提供支持”。
真正的节省,而不仅仅是在AI方面
Damien Lucas, CEO of Scaleway
为了验证 Ampere 团队的说法,我们回到了去年我们见过的 Scaleway 首席执行官 Damien Lucas 那里。他面带微笑,非常直接地说:“Ampere 芯片的节能是真实的”。他说,虽然 ARM CPU 在数据中心的发展之路并不总是一帆风顺, 但“自从 Scaleway 几年前提出并停止使用ARM以来”,该指令集正在强势回归,“这要归功于客户的需求。我认为,一方面,垄断对市场来说从来都不是一件好事,但另一方面,Ampere CPU 可以显著节省能源”。根据 Ampere 的说法,在 AI 中,这意味着 “与英伟达 GPU 相比,推理的增益从 x3到x5”。
An Ampere server from Scaleway
效率的提高并不局限于 AI 推理领域。Damien Lucas 表示:“虽然我们将所有技术和芯片都投放市场,为客户服务,但由于我们与每个人合作,我们在Scaleway 也有自己的基础设施。事实是,我们已经将所有内部服务器从 x86切换到了Ampere。我们的能源费用减少了30%” 他非常兴奋地说。
但是,不要被云玩家的责任冲昏头脑:尽管那些有推理需求的人可能会集体转向 Ampere 这样的芯片,但与能耗这个庞然大物对抗仍有很长的路要走。 “目前这是一场与时间的赛跑。可用的 GPU 永远不够。在 Scaleway,我们为所有类型的客户提供服务。我们可以清楚地看到双重趋势:一方面,我们称之为超密集型计算,另一方面是超高效计算”。能效,是Ampere的强项。
2030年将推出1000核处理器?
处理器计算能力的提高面临着巨大的挑战,比如进一步降低雕刻技巧的困难。然而,Jeff Wittich 似乎并不担心芯片每瓦性能的未来改进。他向我们保证:“即使制造工艺多年来一直停留在3nm,即使使用350W的封装,我们仍然可以做得更好。” 在同意做出预测之前,他承诺:“即使有这些限制,到2030年,我们也可以拥有1000核芯片。我们的架构仍有很大的空间”。 最后他总结道:“因为在我们的世界里,我们不再浪费能源。”
关于 Ampere Computing
Ampere Computing 是一家现代化半导体企业,致力于塑造云计算的未来,并推出了世界上首款云原生处理器。为可持续云而生,Ampere 云原生处理器兼具最高性能和最佳每瓦性能,助力加速多种云计算应用的交付,为云提供行业领先的性能、能效和可扩展性。
-
处理器
+关注
关注
68文章
19259浏览量
229651 -
cpu
+关注
关注
68文章
10854浏览量
211578 -
Ampere
+关注
关注
1文章
66浏览量
4541
原文标题:256核 AI 动力:一款能实时翻译视频并为聊天机器人提供动力的处理器
文章出处:【微信号:AmpereComputing,微信公众号:安晟培半导体】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论