Meta发布采用NVIDIA系统的AI研究超级集群-电子发烧友网

Meta的AI超级计算机是迄今为止最大的NVIDIA DGX A100客户系统。该系统将为Meta的AI研究人员提供5百亿亿次级AI计算性能，采用了最先进的NVIDIA系统、InfiniBand网络和软件，实现了数千个GPU集群的系统优化。

Meta Platforms非常认可NVIDIA，为其有望成为有史以来最强大的研究系统选择了NVIDIA的先进技术。

于今日发布的AI研究超级集群(AI Research SuperCluster，缩写RSC)已在训练新模型以推动AI发展。

全面部署后，Meta的RSC预计将成为最大的NVIDIA DGX A100客户系统。

Meta在一篇博客文章中表示：“我们希望RSC帮助我们建立全新的AI系统，例如可以为多个不同语言的团队提供实时语音翻译，使他们可以在研究项目上无缝协作，甚至一起玩AR游戏。”

训练最大的AI模型

当RSC在今年晚些时候完全建成时，Meta将用它来训练具有超过1万亿个参数的AI模型。这将推动自然语言处理等领域的发展，比如实时识别不法内容等工作。

除了实现规模性能之外，Meta还将超高的可靠性、安全性、隐私性以及处理“各类AI模型”的灵活性作为RSC的关键指标。

Meta的AI研究超级集群拥有数百个NVIDIA DGX系统并通过NVIDIA Quantum InfiniBand网络相连接，助力Meta AI研究团队提高工作速率。

性能大揭秘

目前，此全新AI超级计算机已经部署了760个NVIDIA DGX A100系统作为其计算节点。共有6080个NVIDIA A100 GPU，通过NVIDIA Quantum 200Gb/s InfiniBand网络连接，可提供1895(千万亿次)TF32计算性能。

尽管受到新冠疫情的影响，这样一台可运行的AI超级计算机从想法到实现，RSC仅用了18个月!“功臣”之一便是采用NVIDIA DGX A100技术作为基石。

Penguin Computing是NVIDIA合作伙伴网络中负责RSC交付的合作伙伴。除了760个DGX A100系统和InfiniBand网络之外，Penguin还为Meta提供管理服务和AI基础架构优化，包括一个46PB高速缓存的Altus系统。

性能提升20倍

这是Meta第二次选择NVIDIA技术作为其研究平台的基础。2017年，Meta打造了第一代AI研究基础架构，配备了22000个NVIDIA V100 Tensor Core GPU，每日可处理35000项AI训练工作。

Meta的早期基准测试显示，RSC训练大型NLP模型的速度比之前的系统快3倍，运行计算机视觉工作的速度比之前的系统快20倍。

在今年晚些时候的第二阶段，RSC将扩展至16000个GPU。Meta认为届时RSC将提供高达5百亿亿次级混合精度AI计算性能，并且Meta希望通过扩展RSC的存储系统，以每秒16TB的速度提供高达1EB的数据。

可扩展架构

NVIDIA AI技术适用于任何规模的企业应用。

NVIDIA DGX包含一个完整的NVIDIA AI软件栈，可以轻松地从单个系统扩展至完整的DGX SuperPOD，可以在本地或主机托管商处运行。客户亦可以通过NVIDIA DGX Foundry租用DGX系统。

原文标题：Meta与NVIDIA联合打造大型AI研究超级计算机

文章出处：【微信公众号：NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5093

浏览量
104039
计算机

计算机

+关注

关注
19

文章
7565

浏览量
88872
AI

AI

+关注

关注
87

文章
32023

浏览量
270897

原文标题：Meta与NVIDIA联合打造大型AI研究超级计算机

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

MediaTek与NVIDIA携手设计GB10 Grace Blackwell超级芯片

MediaTek与NVIDIA近日宣布了一项重要合作，双方将共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款超级芯片将被应用于

发表于 01-13 10:48 •227次阅读

NVIDIA推出个人AI超级计算机Project DIGITS

NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS，全球的 AI 研究

发表于 01-08 11:03 •424次阅读

联发科与NVIDIA合作为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片

联发科近日宣布与NVIDIA合作设计NVIDIA GB10 Grace Blackwell超级芯片，将应用于NVIDIA 的个人AI

发表于 01-07 16:26 •230次阅读

Meta发布新AI模型Meta Motivo，旨在提升元宇宙体验

Meta在人工智能领域迈出了重要一步。通过这款模型，Meta希望能够为用户提供更加自然、流畅的元宇宙交互体验。数字代理在元宇宙中的动作将更加逼真，从而增强用户的沉浸感和参与度。除了Meta Motivo，

发表于 12-16 10:34 •578次阅读

NVIDIA加速全球大多数超级计算机推动科技进步

HPCwire 读者和编辑选择奖。自 2006 年发布 CUDA 以来，NVIDIA 不断推动 AI 和加速计算的进步，最新发布的全球最强超级

发表于 11-24 14:38 •415次阅读

赖耶科技通过NVIDIA AI Enterprise平台打造超级AI工厂

与 NVIDIA 技术团队保持合作。赖耶科技通过NVIDIA AI Enterprise平台打造的超级 AI 工厂，致力于加速大模型场景应用

发表于 11-19 14:55 •560次阅读

NVIDIA助力xAI打造全球最大AI超级计算机

NVIDIA 宣布，xAI 位于田纳西州孟菲斯市的Colossus 超级计算机集群达到了 10 万颗 NVIDIA Hopper GPU 的巨大规模。该

发表于 10-30 11:38 •473次阅读

NVIDIA Colossus超级计算机集群突破10万颗Hopper GPU

NVIDIA近日宣布，其位于田纳西州孟菲斯市的xAI Colossus超级计算机集群规模已壮大至10万颗NVIDIA Hopper GPU。这一里程碑式的成就，再次彰显了

发表于 10-30 10:29 •365次阅读

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper GPU 的巨大规模。该集群使用了 NVIDIA S

发表于 10-30 09:33 •200次阅读

NVIDIA助力丹麦发布首台AI超级计算机

这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设，是一台 NVIDIA DGX SuperPOD 超级计算机。

发表于 10-27 09:42 •549次阅读

NVIDIA和Meta CEO探讨AI与仿真模拟技术的潜力

NVIDIA 和 Meta 的首席执行官将在一次难得的公开活动中共同探讨 AI 与仿真模拟技术的潜力。

发表于 09-09 09:14 •549次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

在 AI 超级计算和量子计算服务方面的最新进展。 **10.NVIDIA NIM **软件栈和 OVX 计算系统推出新的软件和计算系统，

发表于 05-13 17:16

NVIDIA全面加快Meta Llama 3的推理速度

Meta 最新开源大语言模型采用 NVIDIA 技术构建，其经过优化后可在云、数据中心、边缘和 PC 的 NVIDIA GPU 上运行。

发表于 04-23 09:52 •564次阅读

NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwel

发表于 03-21 09:49 •844次阅读

NVIDIA 推出 Blackwell 架构 DGX SuperPOD，适用于万亿参数级的生成式 AI 超级计算

基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术，可将集群中 Grace Blackwell 超级芯片的数量扩展至数

发表于 03-19 10:56 •509次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Meta发布采用NVIDIA系统的AI研究超级集群

评论

MediaTek与NVIDIA携手设计GB10 Grace Blackwell超级芯片

NVIDIA推出个人AI超级计算机Project DIGITS

联发科与NVIDIA合作为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片

Meta发布新AI模型Meta Motivo，旨在提升元宇宙体验

NVIDIA加速全球大多数超级计算机推动科技进步

赖耶科技通过NVIDIA AI Enterprise平台打造超级AI工厂

NVIDIA助力xAI打造全球最大AI超级计算机

NVIDIA Colossus超级计算机集群突破10万颗Hopper GPU

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

NVIDIA助力丹麦发布首台AI超级计算机

NVIDIA和Meta CEO探讨AI与仿真模拟技术的潜力

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

NVIDIA全面加快Meta Llama 3的推理速度

NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

NVIDIA 推出 Blackwell 架构 DGX SuperPOD，适用于万亿参数级的生成式 AI 超级计算