0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达与亚马逊联手打造了一台拥有16384个超级芯片的超级计算机

微云疏影 来源:EDN电子技术设计 作者:EDN电子技术设计 2023-12-06 16:01 次阅读

英伟达亚马逊科技宣布,将共同推出首款云AI超级计算机,将英伟达的H200 Grace Hopper超级芯片与亚马逊UltraCluster扩展功能融合。

据悉,该合作项目代号为Project Ceiba,共计搭载了16384颗英伟达H200超级芯片,能够处理65 exaflops速度等级的AI运算,这个超级计算机是配备了H200 NVL32与Amazon EFA互连技术的大规模系统,将部署在亚马逊云科技之上。

这一合作项目的重要性得到了双方高层的亲自站台,亚马逊云科技CEO Adam Selipsky和英伟达CEO黄仁勋纷纷表示,他们共同的目标是发展生成式AI,为各个领域提供成本效益和先进的生成式AI。

亚马逊云科技首席执行官Adam Selipsky 表示:“今天,我们为图形、游戏、高性能计算、机器学习以及现在的生成式人工智能等工作负载提供最广泛的英伟达GPU 解决方案。我们继续与英伟达合作创新,将下一代英伟达Grace Hopper Superchips 与亚马逊云科技的 EFA 强大网络、EC2 UltraClusters 的超大规模集群以及 Nitro 的高级虚拟化功能相结合,使亚马逊云科技成为运行 GPU 的最佳场所。”

Ceiba项目是此次合作的基石,旨在创建世界上最快的 GPU 驱动的 AI 超级计算机,由 亚马逊云科技 托管,并专门为英伟达提供。这个雄心勃勃的项目将集成 16,384 个英伟达GH200 超级芯片(使用 GH200 NVL32 解决方案,包含 32 个 GH200 GPU 和 19.5 TB 统一内存),这些芯片将提供惊人的 65 个“AI ExaFLOPS”处理能力。这台超级计算机用于英伟达的生成式人工智能研发项目。

亚马逊云科技上托管的英伟达DGX 云是此次合作的另一个主要组成部分。该人工智能培训即服务平台是第一个将 GH200 NVL32 机器与 19.5 TB 统一内存结合在一起的商用实例。该平台为开发人员提供了单个实例中可用的最大共享内存,显着加速了高级生成人工智能和大型语言模型的训练过程,可能超过 1 万亿个参数

此外,亚马逊云科技将率先提供 基于Nvidia GH200 Grace Hopper Superchips的基于云的AI超级计算机。这种独特的配置将使用 NVLink 连接每个实例 32 个 Grace Hopper Superchip。它将扩展到数千个 GH200 Superchips(和 4.5 TB HBM3e 内存),与 Amazon 的 EFA 网络连接,并得到高级虚拟化(亚马逊云科技 Nitro System)和超大规模集群(Amazon EC2 UltraClusters)的支持。

此次合作还将推出 新的英伟达支持的Amazon EC2实例。这些实例将配备 H200 Tensor Core GPU,具有高达 141 GB 的 HBM3e 内存,适用于大规模生成式 AI 和高性能计算 (HPC) 工作负载。此外,G6 和 G6e 实例分别配备 NvidiaL4 和 L40S GPU,专为从 AI 微调到 3D 工作流程开发等广泛应用而设计,并利用英伟达Omniverse 创建支持 AI 的 3D 应用程序。

此次合作将引入英伟达的先进软件 ,以加速亚马逊云科技上的生成式 AI 开发。其中包括用于创建聊天机器人和摘要工具的 NeMo LLM 框架和 NeMo Retriever 以及用于加速药物发现流程的 BioNeMo。

英伟达创始人兼首席执行官黄仁勋表示:“生成式 AI 正在改变云工作负载,并将加速计算作为多样化内容生成的基础。”在向每位客户提供经济高效的最先进的生成式人工智能这一共同使命的推动下,Nvidia和亚马逊云科技正在整个计算堆栈上进行合作,涵盖人工智能基础设施、加速库、基础模型和生成式人工智能服务。 ”

此外,亚马逊云科技还宣布了自家芯片的大升级,发布了Graviton4通用AI芯片。与上一代Graviton3相比,Graviton4的计算性能提高了30%,核心数量增加了50%,内存带宽增加了75%。这一芯片将应用于内存优化型的Amazon EC2 R8g实例,提升高性能数据库、内存缓存和大数据分析工作的效率。

另外,Trainum2芯片也亮相,主要用于拥有超大参数模型的训练。相比于上一代Trainium1,Trainum2在速度上提升了4倍,在能效方面也有2倍的提升。这一芯片将支持新的服务,为客户提供大规模的模型构建和训练能力。

亚马逊云科技不仅在硬件方面进行了升级,还发布了生成式AI应用搭建平台Bedrock。亚马逊云科技的Keynote演讲中,还展示了一款名为Amazon Q的工作版ChatGPT,专为企业用户设计,帮助员工利用公司的数据和专业知识获取答案、解决问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4735

    浏览量

    128919
  • 英伟达
    +关注

    关注

    22

    文章

    3773

    浏览量

    91028
  • 亚马逊
    +关注

    关注

    8

    文章

    2662

    浏览量

    83335
收藏 人收藏

    评论

    相关推荐

    云端超级计算机使用教程

    云端超级计算机种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在
    的头像 发表于 12-17 10:19 102次阅读

    丹麦推出首台AI超级计算机Gefion

    近日,丹麦正式推出了该国首台人工智能超级计算机,命名为Gefion,以纪念丹麦神话中的女神。此次揭幕仪式由英伟首席执行官黄仁勋与丹麦国王共同出席,彰显
    的头像 发表于 10-29 15:13 393次阅读

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 437次阅读

    AMD雄心勃勃:计划构建百万级GPU超级计算机集群

    在全球科技竞赛的舞台上,AMD近日宣布项令人瞩目的计划——打造包含多达120万颗GPU的超级
    的头像 发表于 06-27 14:37 663次阅读

    马斯克人工智能初创公司xAI将打造超级计算机,引领AI新纪元

    在科技发展的浪潮中,人工智能(AI)无疑是当今最引人注目的领域之。近日,马斯克的人工智能初创公司xAI再次成为了全球关注的焦点。据悉,该公司计划在不久的将来打造一台装备有最多10万块英伟
    的头像 发表于 06-22 16:37 650次阅读

    马斯克计划打造超级计算机推动AI发展

    科技巨头埃隆·马斯克近日在投资者会议上透露,其人工智能初创公司xAI正全力筹备打造一台超级计算机。这台计算机将作为下
    的头像 发表于 05-28 09:18 537次阅读

    步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    2024年3月19日,[英伟]CEO[黄仁勋]在GTC大会上公布代AI芯片架构BLACKWELL,并推出基于该架构的
    发表于 05-13 17:16

    英伟帮助日本建造混合量子超级计算机

    英伟正在帮助日本建造混合量子超级计算机,这是日本国家量子计算计划的部分。
    的头像 发表于 04-23 14:54 539次阅读

    诺和诺德基金会将联手英伟打造丹麦AI超级计算机

    诺和诺德基金会携手英伟,共同宣布在丹麦打造一台领先的AI超级计算机。这台
    的头像 发表于 03-21 13:43 601次阅读

    Tesla 计划斥资 5 亿美元建造一台由 NVIDIA 的 AI GPU 提供支持的 Dojo 超级计算机

    ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机,因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日Tesla计划
    的头像 发表于 02-19 12:45 564次阅读
    Tesla 计划斥资 5 亿美元建造<b class='flag-5'>一台</b>由 NVIDIA 的 AI GPU 提供支持的 Dojo <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    特斯拉将斥资5亿美元建造Dojo超级计算机

    据外媒报道,特斯拉将在其位于纽约布法罗的超级工厂投资超过5亿美元,建造一台名为Dojo的超级计算机。这举措旨在推进特斯拉的自动驾驶汽车计划
    的头像 发表于 01-29 11:26 697次阅读

    英伟与Equinix合作为企业客户提供超级计算机系统

    近日,数据中心运营商Equinix与芯片巨头英伟宣布达成项重要合作。双方将共同为企业客户提供英伟
    的头像 发表于 01-29 11:20 731次阅读

    特斯拉在布法罗超级工厂投资5亿美元建造Dojo超级计算机

    霍楚尔表示,此次项目投资为5亿美元,并将同时在纽约州立大学建设另一台独立的AI超级计算机。“我很荣幸地告诉大家,特斯拉将在布法罗投资5亿美元,用于其新
    的头像 发表于 01-29 10:58 409次阅读

    欧盟首台百亿亿次级超级计算机JUPITER建设成果显著,进入新阶段

    欧洲超级计算机联盟 EuroHPC JU 曾于 2023 年 10 月宣布,将投资 2.73 亿欧元打造欧洲第一台超大规模超级
    的头像 发表于 01-25 14:40 642次阅读

    亚马逊网络服务与英伟联手打造AI超级计算机

    亚马逊网络服务公司(Amazon Web Services)不久将拥有一台英伟(Nvidia)制造的新型
    的头像 发表于 01-11 11:06 811次阅读