0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Meta发布采用NVIDIA系统的AI研究超级集群

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-02-07 10:40 次阅读

Meta的AI超级计算机是迄今为止最大的NVIDIA DGX A100客户系统。该系统将为Meta的AI研究人员提供5百亿亿次级AI计算性能,采用了最先进的NVIDIA系统、InfiniBand网络和软件,实现了数千个GPU集群的系统优化。

Meta Platforms非常认可NVIDIA,为其有望成为有史以来最强大的研究系统选择了NVIDIA的先进技术。

于今日发布的AI研究超级集群(AI Research SuperCluster,缩写RSC)已在训练新模型以推动AI发展。

全面部署后,Meta的RSC预计将成为最大的NVIDIA DGX A100客户系统。

Meta在一篇博客文章中表示:“我们希望RSC帮助我们建立全新的AI系统,例如可以为多个不同语言的团队提供实时语音翻译,使他们可以在研究项目上无缝协作,甚至一起玩AR游戏。”

训练最大的AI模型

当RSC在今年晚些时候完全建成时,Meta将用它来训练具有超过1万亿个参数的AI模型。这将推动自然语言处理等领域的发展,比如实时识别不法内容等工作。

除了实现规模性能之外,Meta还将超高的可靠性、安全性、隐私性以及处理“各类AI模型”的灵活性作为RSC的关键指标。

Meta的AI研究超级集群拥有数百个NVIDIA DGX系统并通过NVIDIA Quantum InfiniBand网络相连接,助力Meta AI研究团队提高工作速率。

性能大揭秘

目前,此全新AI超级计算机已经部署了760个NVIDIA DGX A100系统作为其计算节点。共有6080个NVIDIA A100 GPU,通过NVIDIA Quantum 200Gb/s InfiniBand网络连接,可提供1895(千万亿次)TF32计算性能。

尽管受到新冠疫情的影响,这样一台可运行的AI超级计算机从想法到实现,RSC仅用了18个月!“功臣”之一便是采用NVIDIA DGX A100技术作为基石。

Penguin Computing是NVIDIA合作伙伴网络中负责RSC交付的合作伙伴。除了760个DGX A100系统和InfiniBand网络之外,Penguin还为Meta提供管理服务和AI基础架构优化,包括一个46PB高速缓存的Altus系统。

性能提升20倍

这是Meta第二次选择NVIDIA技术作为其研究平台的基础。2017年,Meta打造了第一代AI研究基础架构,配备了22000个NVIDIA V100 Tensor Core GPU,每日可处理35000项AI训练工作。

Meta的早期基准测试显示,RSC训练大型NLP模型的速度比之前的系统快3倍,运行计算机视觉工作的速度比之前的系统快20倍。

在今年晚些时候的第二阶段,RSC将扩展至16000个GPU。Meta认为届时RSC将提供高达5百亿亿次级混合精度AI计算性能,并且Meta希望通过扩展RSC的存储系统,以每秒16TB的速度提供高达1EB的数据。

可扩展架构

NVIDIA AI技术适用于任何规模的企业应用。

NVIDIA DGX包含一个完整的NVIDIA AI软件栈,可以轻松地从单个系统扩展至完整的DGX SuperPOD,可以在本地或主机托管商处运行。客户亦可以通过NVIDIA DGX Foundry租用DGX系统。

原文标题:Meta与NVIDIA联合打造大型AI研究超级计算机

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5093

    浏览量

    104039
  • 计算机
    +关注

    关注

    19

    文章

    7565

    浏览量

    88872
  • AI
    AI
    +关注

    关注

    87

    文章

    32023

    浏览量

    270897

原文标题:Meta与NVIDIA联合打造大型AI研究超级计算机

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    相关推荐

    MediaTek与NVIDIA携手设计GB10 Grace Blackwell超级芯片

    MediaTek与NVIDIA近日宣布了一项重要合作,双方将共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款超级芯片将被应用于
    的头像 发表于 01-13 10:48 227次阅读

    NVIDIA推出个人AI超级计算机Project DIGITS

    NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS,全球的 AI 研究
    的头像 发表于 01-08 11:03 424次阅读

    联发科与NVIDIA合作 为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片

    联发科近日宣布与NVIDIA合作设计NVIDIA GB10 Grace Blackwell超级芯片,将应用于NVIDIA 的个人AI
    的头像 发表于 01-07 16:26 230次阅读

    Meta发布AI模型Meta Motivo,旨在提升元宇宙体验

    Meta在人工智能领域迈出了重要一步。通过这款模型,Meta希望能够为用户提供更加自然、流畅的元宇宙交互体验。数字代理在元宇宙中的动作将更加逼真,从而增强用户的沉浸感和参与度。 除了Meta Motivo,
    的头像 发表于 12-16 10:34 578次阅读

    NVIDIA加速全球大多数超级计算机推动科技进步

    HPCwire 读者和编辑选择奖。 自 2006 年发布 CUDA 以来,NVIDIA 不断推动 AI 和加速计算的进步,最新发布的全球最强超级
    的头像 发表于 11-24 14:38 415次阅读
    <b class='flag-5'>NVIDIA</b>加速全球大多数<b class='flag-5'>超级</b>计算机推动科技进步

    赖耶科技通过NVIDIA AI Enterprise平台打造超级AI工厂

    NVIDIA 技术团队保持合作。赖耶科技通过NVIDIA AI Enterprise平台打造的超级 AI 工厂,致力于加速大模型场景应用
    的头像 发表于 11-19 14:55 560次阅读

    NVIDIA助力xAI打造全球最大AI超级计算机

    NVIDIA 宣布,xAI 位于田纳西州孟菲斯市的Colossus 超级计算机集群达到了 10 万颗 NVIDIA Hopper GPU 的巨大规模。该
    的头像 发表于 10-30 11:38 473次阅读

    NVIDIA Colossus超级计算机集群突破10万颗Hopper GPU

    NVIDIA近日宣布,其位于田纳西州孟菲斯市的xAI Colossus超级计算机集群规模已壮大至10万颗NVIDIA Hopper GPU。这一里程碑式的成就,再次彰显了
    的头像 发表于 10-30 10:29 365次阅读

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

    市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper  GPU 的巨大规模。该集群使用了 NVIDIA S
    发表于 10-30 09:33 200次阅读
    <b class='flag-5'>NVIDIA</b> 以太网加速 xAI 构建的全球最大 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b>计算机

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机。
    的头像 发表于 10-27 09:42 549次阅读

    NVIDIAMeta CEO探讨AI与仿真模拟技术的潜力

    NVIDIAMeta 的首席执行官将在一次难得的公开活动中共同探讨 AI 与仿真模拟技术的潜力。
    的头像 发表于 09-09 09:14 549次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    AI 超级计算和量子计算服务方面的最新进展。 **10.NVIDIA NIM **软件栈和 OVX 计算系统 推出新的软件和计算系统
    发表于 05-13 17:16

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新开源大语言模型采用 NVIDIA 技术构建,其经过优化后可在云、数据中心、边缘和 PC 的 NVIDIA GPU 上运行。
    的头像 发表于 04-23 09:52 564次阅读

    NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

    NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwel
    的头像 发表于 03-21 09:49 844次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数
    发表于 03-19 10:56 509次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b>计算