NVIDIA Grace Hopper超级芯片赋能推荐系统-电子发烧友网

借助 Grace Hopper 超级芯片，有助于用户个性化互联网的大规模 AI 模型的性能更加准确。

作为互联网的经济引擎，推荐系统获得了 NVIDIA Grace Hopper 超级芯片的全新加持。

推荐系统每天向数十亿人提供数万亿的搜索结果、广告、产品、音乐和新闻报道。这些系统在帮助用户从嘈杂的信息中获取有用信息时令人难以置信地高效，因此是我们这个时代最重要的 AI 模型之一。

这些机器学习工作流使用 TB 级数据。推荐系统消耗的数据越多，结果就越准确，所提供的投资回报就越多。

为了应对这些数据海啸，各公司已经开始采用加速计算来为客户提供个性化服务。Grace Hopper 将把加速计算带来的好处提升到一个新的高度。

GPU 可将参与度提高 16%

图片共享社交媒体公司 Pinterest 通过采用 NVIDIA GPU，可以将推荐系统模型的规模提升至原来的 100 倍。直接帮助其 4 亿多用户的参与度提高了 16%。

该公司的一位软件工程师在最近的一篇博客中表示：“通常情况下，能有 2% 的增长我们就已经感到很满意了，而现在，16% 仅仅是个开始。我们看到了额外的收益，它打开了许多机会之门。”

新一代 NVIDIA AI 平台有望为使用超大规模推荐系统模型处理大规模数据集的公司带来更大的收益。

由于数据是 AI 的燃料，Grace Hopper 相比地球上任何其他处理器旨在将更多数据输送给推荐系统。

NVLink 加速 Grace Hopper

Grace Hopper 能够实现这一点，是因为它是一种超级芯片，一个单元包含两个芯片，共享高速的芯片到芯片互连。它包括一个基于 ARM 的 NVIDIA Grace CPU 和一个 Hopper GPU，它们之间通过 NVIDIA NVLink-C2C 进行通信。

此外，NVLink 还将许多超级芯片连接成一个超级系统，是专为运行 TB 级推荐系统而构建的计算集群。

NVLink 以高达每秒 900 GB 的速度传输数据，是 PCIe 5.0 带宽的 7 倍，后者是即将推出的前沿系统将使用的互联带宽。

这意味着 Grace Hopper 向推荐系统提供 7 倍以上的向量表示（包含上下文），满足用户对个性化结果的需求。

内存越大，效率越高

Grace CPU 使用 LPDDR5X，这种内存在用于推荐系统和其他要求苛刻的工作负载时，能够在带宽、能效、容量和成本之间达到最佳平衡。它提供的带宽增加 50%，而每 GB 的功耗仅为传统 DDR5 内存子系统的八分之一。

集群中的任何 Hopper GPU 都可以通过 NVLink 访问 Grace 的内存。这是 Grace Hopper 的一项功能，可提供之前没有的庞大的 GPU 显存池。

此外，NVLink-C2C 每传输一位数据仅需 1.3 皮焦，其能效是 PCIe 5.0 的 5 倍以上。

总体效果上，与采用传统 CPU 的 Hopper 相比，推荐系统在使用 Grace Hopper 时的性能和效率提升高达 4 倍（请参阅下图）。

您需要的所有软件

Grace Hopper 超级芯片使用全堆栈的 NVIDIA AI 软件，这些软件被用于当今世界最大的推荐系统之中。

NVIDIA Merlin 是推荐系统的强大动力，它包含构建 AI 系统的模型、方法和库的集合，可以提供更好的预测并增加点击率。

NVIDIA Merlin HugeCTR 是一种推荐系统框架，可在 NVIDIA 集合通信库的帮助下，帮助用户在分布式 GPU 集群下快速处理大量数据集。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4795

浏览量
129498
NVIDI

NVIDI

+关注

关注
0

文章
6

浏览量
7415
推荐系统

推荐系统

+关注

关注
1

文章
43

浏览量
10098
超级芯片

超级芯片

+关注

关注
0

文章
36

浏览量
8920

原文标题：GTC22 | 为什么新的 NVIDIA Grace Hopper 超级芯片是新一代推荐系统的理想之选

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

MediaTek与NVIDIA携手设计GB10 Grace Blackwell超级芯片

MediaTek与NVIDIA近日宣布了一项重要合作，双方将共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款

发表于 01-13 10:48 •206次阅读

MediaTek与NVIDIA携手打造超级芯片

近日，在即将举行的CES2025消费电子展上，MediaTek宣布了一项重大合作——与NVIDIA共同设计NVIDIA GB10 Grace Blackwell超级

发表于 01-10 13:49 •209次阅读

MediaTek与NVIDIA携手打造GB10 Grace Blackwell超级芯片

MediaTek近日正式宣布与NVIDIA携手合作，共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款

发表于 01-08 15:32 •378次阅读

NVIDIA推出个人AI超级计算机Project DIGITS

NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS，全球的 AI 研究员、数据科学家和学生都可获取 NVIDIA

发表于 01-08 11:03 •398次阅读

联发科与NVIDIA合作为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片

联发科近日宣布与NVIDIA合作设计NVIDIA GB10 Grace Blackwell超级芯片，将应用于

发表于 01-07 16:26 •222次阅读

NVIDIA Colossus超级计算机集群突破10万颗Hopper GPU

NVIDIA近日宣布，其位于田纳西州孟菲斯市的xAI Colossus超级计算机集群规模已壮大至10万颗NVIDIA Hopper GPU。这一里程碑式的成就，再次彰显了

发表于 10-30 10:29 •353次阅读

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

NVIDIA Spectrum-X 使基于 NVIDIA Hopper 十万卡 GPU 的巨型系统成为可能 2024 年 10 月 28 日 —

发表于 10-30 09:33 •185次阅读

NVIDIA AI Enterprise荣获金奖

NVIDIA AI Enterprise、GH200 Grace Hopper 超级芯片和 Spectrum-X 在 COMPUTEX 20

发表于 05-29 09:27 •514次阅读

亚马逊未中断英伟达订单，等待Grace Blackwell更强性能

英国《金融时报》昨日报道称，亚马逊AWS已暂停订购英伟达最新款“超级芯片”Grace Hopper，等待性能更强的新品Grace Black

发表于 05-22 11:00 •542次阅读

NVIDIA Grace Hopper点亮AI超级计算新时代

瑞士 Alps、法国 EXA1-HE 等超级计算机将使用高能效的、基于 Grace 的系统为气候和天气、科学探索等领域提供 200 EFLOPS AI 算力，以支持突破性研究。

发表于 05-15 09:46 •436次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

提升至 30 倍 GB200 NVL72 集群将多个由 GB200 驱动的系统整合到一个液冷机架中。连接 36 个 GB200 超级芯片（36 个Grace中央处理器和 72 个Bla

发表于 05-13 17:16

NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

德国、日本和波兰的超级计算机利用 Grace-Hopper 和量子-经典加速超算平台推进量子计算研究德国汉堡 —— 国际超算大会（ISC）—— 2024 年 5 月 13 日

发表于 05-13 15:21 •233次阅读

美国首个Grace Hopper架构超算Venado落地：达10 exaFLOPS

该超级计算机是由惠普企业集团（Hewlett Packard Enterprise）打造，其运算能力高达 10 exaFLOPS，它是美国第一款采用英伟达Grace Hopper芯片架

发表于 04-18 14:37 •488次阅读

NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级

发表于 03-21 09:49 •831次阅读

NVIDIA 推出 Blackwell 架构 DGX SuperPOD，适用于万亿参数级的生成式 AI 超级计算

基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术，可将集群中 Grace Blackwell 超级芯片的数量扩展至数

发表于 03-19 10:56 •491次阅读