0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达超级计算机Eos揭秘

SSDFans 来源:SSDFans 2024-04-24 10:15 次阅读

去年11月,Nvidia凭借一款名为Eos的系统突然出现在全球最快超级计算机500强榜单的第9位,引起了一些人的注意。Eos是以每天打开黎明大门的希腊女神命名的,是英伟达的企业级AI训练系统,该公司现在首次发布了一段视频向公众展示它。

Eos本质上是英伟达自己的超级计算机,员工每天都可以用它来进行AI训练,或者在午休时间玩《孤岛危机》。它包括一个由576台DGX H100服务器组成的集群,由于每台服务器都有8个H100 GPU,因此总共有4608台H100与其Quantum-2 InfiniBand技术连接在一起。这基本上是英伟达展示其DGX SuperPod设计的极端版本,是一种企业规模的AI训练,它希望将其出售给拥有巨额预算和大量AI模型的公司。

英伟达将Eos描述为一个可以为“AI工厂”提供动力的系统,因为它是一个非常大规模的SuperPod DGX H100系统。该公司表示,正是这一点让它能够在AI方面有所突破,并展示了英伟达最新技术在放大到超大规模时的强大功能。

DGX H100服务器使用英特尔Xeon Platinum8480C CPU,具有56核和112线程。与4608个H100 GPU相结合,它提供了121 PetaFLOPS的Linpack性能,仅足以在Top500中排名第9,但这更像是一个通用指标。如果纯粹以AI训练来衡量,它很容易成为目前世界上最快的系统之一。

当该系统去年首次亮相时,英伟达展示了比之前基于Ampere的A100系统的巨大改进。例如,在一个模拟训练GPT-3模型的测试中,Eos只花了4分钟,而基于A100的系统花了11分钟。然而,之前的系统只使用512个GPU,而Eos更大、使用更强大的GPU,所以预期会有显著的提升。

然而,我们在研究英伟达的最新声明时发现了一个差异。早在2023年11月,英伟达就表示Eos配备了10,752个H100GPU。在最新的公告中,这个数字已经减少到4608,所以我们不确定发生了什么变化,或者Eos是否已经缩小了一些。

我们通过电子邮件向英伟达寻求澄清,一位发言人回应说:“为了提供一些清晰的信息,用于MLPerf LLM训练的超级计算机具有10,752个H100 GPU,是使用相同DGX SuperPOD架构构建的不同系统。在2023年TOP500榜单上排名第九的系统是现在博客和视频中介绍的4608 GPU Eos系统。”

当问及为什么这两个系统都被命名为Eos时,发言人回答说:“我们在Eos一代中部署了多个系统,它们都基于相同的NVIDIA DGX SuperPOD架构。”

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 超级计算机
    +关注

    关注

    2

    文章

    452

    浏览量

    41818
  • AI
    AI
    +关注

    关注

    87

    文章

    28825

    浏览量

    266159
  • 英伟达
    +关注

    关注

    22

    文章

    3630

    浏览量

    89816

原文标题:揭秘:英伟达用于AI训练的Eos超级计算机!

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟与佛罗里大学联手打造高等教育AI超级计算机

    英伟周二表示,该公司已与佛罗里大学合作,将联手打造全球速度最快的高等教育人工智能(AI)超级计算机。这个项目价值7000万美元,内容包括
    的头像 发表于 07-22 10:05 3137次阅读

    超级计算机和特种计算机的比较和价值

    超级计算机和特种计算机的比较和价值 在最新公布的全球高性能计算机TOP500强排行榜中,由中科院计算所国家智能
    发表于 12-01 08:02 1088次阅读

    新加坡与富士通准备打造的超级计算机

    新加坡与富士通准备打造的超级计算机  新加坡科技研究局将与日本富士通(Fujitsu)打造东南亚最快、运算速度千万亿次的超级计算机(pe
    发表于 01-22 09:48 727次阅读

    英伟推出最新嵌入式计算机Jetson Nano

    英伟正在为其Jetson产品系列推出一款新的嵌入式计算机,用于开发部署人工智能,这是迄今为止最小的计算机,CUDA-X计算机被命名为Jet
    发表于 09-18 11:47 3435次阅读

    英伟发布全球最小的边缘AI超级计算机

    英伟宣布推出全球尺寸最小的边缘AI超级计算机Jetson Xavier NX,主要面向机器人和边缘嵌入式计算设备。
    的头像 发表于 11-07 14:57 3167次阅读

    英伟将收购ARM,并建立一台ARM/NVIDIA驱动的AI超级计算机

    英伟表示,收购将扩大 ARM 在英国剑桥的研发力量,建立一个世界级的 AI 研究和教育中心,并建立一台 ARM/NVIDIA 驱动的 AI 超级计算机,用于突破性研究。
    的头像 发表于 09-14 10:52 1991次阅读

    英伟计划建造英国最快的超级计算机

    Nvidia首席执行官黄仁勋(Jensen Huang)表示,将被评为全球第29大最强大的超级计算机的Cambridge-1,将提供给使用人工智能解决紧急医疗挑战的医疗研究人员。
    的头像 发表于 10-11 10:28 2027次阅读

    NVIDIA的加速计算平台将用于构建世界上最快的AI超级计算机

    英伟(Nvidia)周四宣布,其加速计算平台将用于构建其声称将成为世界上最快的AI超级计算机的东西。
    的头像 发表于 10-17 11:07 2112次阅读

    英伟将联合CINECA来构建世界上最快的AI超级计算机

     10月16日消息 英伟宣布将联合意大利大学研究中心 CINECA(世界上最重要的超级计算中心之一)来构建世界上最快的 AI 超级
    的头像 发表于 10-18 09:29 2108次阅读

    搭载256颗GH200超级芯片的超级计算机

    据悉,DGX GH200的内存储量是英伟目前DGXA100系统的近500倍。英伟CEO黄仁勋在COMPUTEX2023的主题演讲中表示:“DGXGH200人工智能
    的头像 发表于 05-30 10:23 1075次阅读

    英伟推出超级计算机DGX GH200

    DGX GH200人工智能超级计算机则集成了英伟最先进加速计算和网络技术。
    的头像 发表于 05-30 16:20 2509次阅读

    亚马逊网络服务与英伟联手打造AI超级计算机

    亚马逊网络服务公司(Amazon Web Services)不久将拥有一台由英伟(Nvidia)制造的新型超级计算机,该公司称这是世界上速度最快的人工智能系统之一。
    的头像 发表于 01-11 11:06 651次阅读

    英伟与Equinix合作为企业客户提供超级计算机系统

    近日,数据中心运营商Equinix与芯片巨头英伟宣布达成一项重要合作。双方将共同为企业客户提供英伟超级
    的头像 发表于 01-29 11:20 598次阅读

    诺和诺德基金会将联手英伟打造丹麦AI超级计算机

    诺和诺德基金会携手英伟,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动
    的头像 发表于 03-21 13:43 433次阅读

    英伟帮助日本建造混合量子超级计算机

    英伟正在帮助日本建造混合量子超级计算机,这是日本国家量子计算计划的一部分。
    的头像 发表于 04-23 14:54 425次阅读