0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊网络服务与英伟达联手打造AI超级计算机

SSDFans 来源:SSDFans 2024-01-11 11:06 次阅读

亚马逊网络服务公司(Amazon Web Services)不久将拥有一台由英伟达(Nvidia)制造的新型超级计算机,该公司称这是世界上速度最快的人工智能系统之一。

在使用 FP8 数据类型测试时,该系统可提供 65 exaflops 的人工智能性能。Nvidia 负责超大规模和 HPC 的副总裁 Ian Buck 在新闻发布会上说,这也是世界上第一台基于 ARM云计算 AI 超级计算机。

新的DGX Cloud Project Ceiba系统围绕Nvidia组件构建,但经过调整后可连接到AWS的Nitro芯片,后者提供底层网络、存储和安全基础设施。

Project Ceiba将于2024年安装完毕,届时可供客户使用。该系统与其他Nvidia DGX Cloud实施系统不同,后者已被克隆到微软的Azure、甲骨文云和谷歌云上。

65 exaflops的性能来自5个Grace Hopper超级芯片,机架由AWS的弹性结构适配器连接,用于超级计算应用程序。

Buck说:"这台新的超级计算机将在 AWS 基础设施中运行,并由 Nvidia 自己的研究和工程团队开发用于开发图形、大型语言模型研究的新人工智能,并用于数字生物学、机器人研究和自动驾驶汽车。

AWS 还发布了搭载英伟达H200、L40S和L4 GPU的新虚拟机。这些产品是在拉斯维加斯举行的 ReInvent 大会上发布的。

AWS 还发布了其最新 CPU Graviton4,它是 Graviton3 的后继产品,将被用于 EC2。不过,亚马逊在一篇博客文章中称,与 Graviton3 芯片相比,该 CPU 的内核增加了 50%,速度提高了 30%,内存带宽增加了 75%。

CCS Insight 首席分析师詹姆斯-桑德斯(James Sanders)说,考虑到 Graviton 处理器与 Arm Neoverse 内核设计发布节奏之间的关系,Graviton4 的发布在意料之中。Graviton4 以 Neoverse V2 为蓝本,而 Graviton 3 则以 Neoverse V1 为蓝本。

"两者在微架构上的主要变化是升级到了Armv9,从而提高了进程隔离和向量扩展。桑德斯说:"前者在云环境中非常有用,也是对 Spectre 和 Meltdown 等侧信道攻击的一种反应,而后者则对人工智能推理非常有用。

最新的CPU是Graviton 3E,它是AWS用于超级计算的最高性能CPU。桑德斯说,Graviton4全面上市后,将有更多不同价位的实例类型可供选择。

相比之下,微软新推出的 Cobalt 100 是基于 Arm 的 Neoverse N2 CSS,也是 Armv9。Neoverse N 系列面向主流数据中心,而 V 系列则面向更高性能的工作负载,这将使 Graviton4 更具优势。

亚马逊也终于发布了名为 Trainium2 的下一代训练芯片,其训练速度是近三年前发布的首款 Trainium 芯片的四倍。

"亚马逊在一篇博文中说:"它将能部署在多达 10 万个芯片的 EC2 UltraClusters 中,使基础模型和大型语言模型(LLM)的训练只需极少的时间,同时能效提高达 2 倍。

AWS 现在拥有两款 ARM CPU,包括 Nvidia 的 Grace 和自己的 Graviton4。Nvidia的Grace提供对GPU的访问,而Graviton4提供对Trainium的访问。Graviton4 目前还不能与 Nvidia GPU 协同工作。

由于模型开发和定制的增加,这方面的需求是存在的,尽管这需要对针对 Nvidia CUDA 环境的项目进行一些工具调整。

"桑德斯说:"奇怪的是,[AWS 首席执行官]亚当-塞利普斯基(Adam Selipsky)指出,当谷歌正在使用第四代 TPU 时,其他云计算公司才在谈论它们的 AI 芯片。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28053

    浏览量

    205728
  • 适配器
    +关注

    关注

    8

    文章

    1909

    浏览量

    67817
  • 超级计算机
    +关注

    关注

    2

    文章

    459

    浏览量

    41897
  • HPC
    HPC
    +关注

    关注

    0

    文章

    308

    浏览量

    23637
  • 英伟达
    +关注

    关注

    22

    文章

    3707

    浏览量

    90596

原文标题:亚马逊网络服务与英伟达联手打造AI超级计算机,达到65 Exaflops的性能新高度!

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    丹麦推出首台AI超级计算机Gefion

    近日,丹麦正式推出了该国首台人工智能超级计算机,命名为Gefion,以纪念丹麦神话中的女神。此次揭幕仪式由英伟首席执行官黄仁勋与丹麦国王共同出席,彰显了该项目的重要性和影响力。 Ge
    的头像 发表于 10-29 15:13 271次阅读

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 298次阅读

    云端超级计算机怎么用

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过
    的头像 发表于 10-18 10:14 66次阅读

    AMD雄心勃勃:计划构建百万级GPU超级计算机集群

    在全球科技竞赛的舞台上,AMD近日宣布了一项令人瞩目的计划——打造一个包含多达120万颗GPU的超级计算机集群。这一宏大的举措立即引发了业界的广泛关注,许多人认为,这是AMD为了与英伟
    的头像 发表于 06-27 14:37 591次阅读

    马斯克人工智能初创公司xAI将打造超级计算机,引领AI新纪元

    在科技发展的浪潮中,人工智能(AI)无疑是当今最引人注目的领域之一。近日,马斯克的人工智能初创公司xAI再次成为了全球关注的焦点。据悉,该公司计划在不久的将来打造一台装备有最多10万块英伟
    的头像 发表于 06-22 16:37 565次阅读

    马斯克计划打造超级计算机推动AI发展

    科技巨头埃隆·马斯克近日在投资者会议上透露,其人工智能初创公司xAI正全力筹备打造一台超级计算机。这台计算机将作为下一版人工智能聊天机器人Grok的强大后盾,为其提供强大的算力支持。
    的头像 发表于 05-28 09:18 490次阅读

    进一步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    新的标准。Blackwell架构和GB200 超级芯片有望推动英伟在人工智能领域更进一步,巩固其在高性能计算和人工智能技术领域的领先地位。随着亚马
    发表于 05-13 17:16

    英伟超级计算机Eos揭秘

    英伟将Eos描述为一个可以为“AI工厂”提供动力的系统,因为它是一个非常大规模的SuperPod DGX H100系统。
    的头像 发表于 04-24 10:15 487次阅读

    英伟帮助日本建造混合量子超级计算机

    英伟正在帮助日本建造混合量子超级计算机,这是日本国家量子计算计划的一部分。
    的头像 发表于 04-23 14:54 494次阅读

    诺和诺德基金会将联手英伟打造丹麦AI超级计算机

    诺和诺德基金会携手英伟,共同宣布在丹麦打造一台领先的AI超级计算机。这台
    的头像 发表于 03-21 13:43 524次阅读

    LTE中连接亚马逊网络服务的入门指南

    电子发烧友网站提供《LTE中连接亚马逊网络服务的入门指南.pdf》资料免费下载
    发表于 02-22 09:34 0次下载
    LTE中连接<b class='flag-5'>亚马逊</b><b class='flag-5'>网络服务</b>的入门指南

    英伟与Equinix合作为企业客户提供超级计算机系统

    近日,数据中心运营商Equinix与芯片巨头英伟宣布达成一项重要合作。双方将共同为企业客户提供英伟超级
    的头像 发表于 01-29 11:20 662次阅读

    英伟亚马逊联手打造了一台拥有16384个超级芯片的超级计算机

    亚马逊云科技首席执行官Adam Selipsky 表示:“今天,我们为图形、游戏、高性能计算、机器学习以及现在的生成式人工智能等工作负载提供最广泛的英伟GPU 解决方案。我们继续与
    的头像 发表于 12-06 16:01 698次阅读

    亚马逊云科技与 NVIDIA 宣布开展战略合作,为生成式 AI 提供全新超级计算基础架构、软件和服务

    亚马逊云科技将提供首款搭载 NVIDIA Grace Hopper 超级芯片 和亚马逊云科技可扩展性 UltraCluster 的云  AI 超级
    的头像 发表于 11-29 21:00 588次阅读
    <b class='flag-5'>亚马逊</b>云科技与 NVIDIA 宣布开展战略合作,为生成式 <b class='flag-5'>AI</b> 提供全新<b class='flag-5'>超级</b><b class='flag-5'>计算</b>基础架构、软件和<b class='flag-5'>服务</b>

    linux重启网络服务

    网络服务是现代计算机系统中不可或缺的一部分,而Linux作为开源的操作系统,其网络服务的管理和维护也成为系统管理员的一项重要工作。本文将详细介绍Linux下网络服务的重启方法以及重启过
    的头像 发表于 11-17 09:53 1147次阅读