首个采用NVIDIA M2050 GPU的实例开启GPU云计算下个十年-电子发烧友网

十年前，AWS（Amazon Web Services）发布了首个采用 NVIDIA M2050 GPU 的实例。当时，基于 CUDA 的应用主要专注于加速科学模拟，AI 和深度学习还遥遥无期。

自那时起，AW 就不断扩充云端 GPU 实例阵容，包括 K80（p2）、K520（g3）、M60（g4）、V100（p3 / p3dn）和 T4（g4）。

现在，已全面上市的全新 AWS P4d 实例采用最新 NVIDIA A100 Tensor Core GPU，开启了加速计算的下一个十年。

全新的 P4d 实例，为机器学习训练和高性能计算应用提供 AWS 上性能与成本效益最高的 GPU 平台。与默认的 FP32 精度相比，全新实例将 FP16 机器学习模型的训练时间减少多达 3 倍，将 TF32 机器学习模型的训练的时间减少多达 6 倍。

这些实例还提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基准测试中一骑绝尘，实现了比 CPU 快 237 倍的性能。

每个 P4d 实例均内置八个 NVIDIA A100 GPU，通过 AWS UltraClusters，客户可以利用 AWS 的 Elastic Fabric Adapter（EFA）和 Amazon FSx 提供的可扩展高性能存储，按需、可扩展地同时访问多达 4,000 多个 GPU。P4d 提供 400Gbps 网络，通过使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技术，进一步加速深度学习训练的工作负载。EFA 上的 NVIDIA GPUDirect RDMA 在服务器之间可通过 GPU 传输数据，无需通过 CPU 和系统内存，从而确保网络的低延迟。

此外，许多 AWS 服务都支持 P4d 实例，包括 Amazon Elastic Container Services、Amazon Elastic Kubernetes Service、AWS ParallelCluster 和 Amazon SageMaker。P4d 还可使用所有 NGC 提供的经过优化的容器化软件，包括 HPC 应用、AI 框架、预训练模型、Helm 图表以及 TensorRT 和 Triton Inference Server 等推理软件。

目前，P4d 实例已在美国东部和西部上市，并将很快扩展到其他地区。用户可以通过按需实例（On-Demand）、Savings Plans、预留实例（Reserved Instances）或竞价型实例（Spot Instances）几种不同的方式进行购买。

GPU 云计算发展最初的十年，已为市场带来超过 100 exaflops 的 AI 计算。随着基于 NVIDIA A100 GPU 的 Amazon EC2 P4d 实例的问世，GPU 云计算的下一个十年将迎来一个美好的开端。

NVIDIA 和 AWS 不断帮助各种应用突破 AI 的界限，以便了解客户将如何运用 AI 强大的性能。

编辑：hfy

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5026

浏览量
103270
gpu

gpu

+关注

关注
28

文章
4754

浏览量
129080
AI

AI

+关注

关注
87

文章
31158

浏览量
269505
机器学习

机器学习

+关注

关注
66

文章
8428

浏览量
132778
AWS

AWS

+关注

关注
0

文章
432

浏览量
24410

NVIDIA和GeForce RTX GPU专为AI时代打造

NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。

发表于 01-06 10:45 •131次阅读

GPU加速云服务器怎么用的

GPU加速云服务器是将GPU硬件与云计算服务相结合，通过云服务提供商的平台，用户可以根据需求灵活

发表于 12-26 11:58 •85次阅读

GPU云服务器租用费用贵吗

在云计算领域，GPU云服务器因其强大的计算能力和图形处理能力，被广泛应用于多个领域。然而，对于许多企业和个人开发者来说，

发表于 12-19 17:55 •173次阅读

《CST Studio Suite 2024 GPU加速计算指南》

的各个方面，包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 -

发表于 12-16 14:25

GPU云服务器租用多少钱

GPU云服务器的租用价格受多种因素影响，包括服务提供商、GPU型号和性能、实例规格、计费模式、促销活动以及地域差异等。下面，AI部落小编为您整理GP

发表于 12-09 10:50 •177次阅读

如何构建及优化GPU云网络

并从计算节点成本优化、集群网络与拓扑的选择等方面论述如何构建及优化GPU云网络。

发表于 11-06 16:03 •400次阅读

AMD与NVIDIA GPU优缺点

在图形处理单元（GPU）市场，AMD和NVIDIA是两大主要的竞争者，它们各自推出的产品在性能、功耗、价格等方面都有着不同的特点和优势。一、性能 GPU的性能是用户最关心的指标之一。在高端市场

发表于 10-27 11:15 •820次阅读

GPU加速计算平台是什么

GPU加速计算平台，简而言之，是利用图形处理器（GPU）的强大并行计算能力来加速科学计算、数据分析、机器学习等复杂

发表于 10-25 09:23 •261次阅读

亚马逊云科技宣布Amazon EC2 P5e实例正式可用由英伟达H200 GPU提供支持

北京2024年9月18日 /美通社/ -- 亚马逊云科技宣布由英伟达H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e（Amazon EC2 P5e）

发表于 09-19 16:16 •504次阅读

GPU云服务器架构解析及应用优势

GPU云服务器作为一种高性能计算资源，近年来在人工智能、大数据分析、图形渲染等领域得到了广泛应用。它结合了云计算的灵活性与

发表于 08-14 09:43 •422次阅读

暴涨预警！NVIDIA GPU供应大跳水

gpu

jf_02331860
发布于 :2024年07月26日 09:41:42

NVIDIA全面转向开源GPU内核模块

借助 R515 驱动程序，NVIDIA 于 2022 年 5 月发布了一套开源的 Linux GPU 内核模块，该模块采用双许可证，即 GPL 和 MIT 许可。初始版本主要面向数据中

发表于 07-25 09:56 •457次阅读

恒讯科技的GPU云解决方案有什么特点和优势？

GPU云解决方案通常指的是云服务提供商提供的、基于图形处理单元（GPU）的计算服务。这些服务利用GPU

发表于 06-12 17:24 •415次阅读

新手小白怎么学GPU云服务器跑深度学习?

新手小白想用GPU云服务器跑深度学习应该怎么做? 用个人主机通常pytorch可以跑但是LexNet，AlexNet可能就直接就跑不动,如何实现更经济便捷的实现GPU云服务器深度学习?

发表于 06-11 17:09

FPGA在深度学习应用中或将取代GPU

现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题在过去的十年里，人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅

发表于 03-21 15:19

搜索历史

首个采用NVIDIA M2050 GPU的实例开启GPU云计算下个十年

评论

NVIDIA和GeForce RTX GPU专为AI时代打造

GPU加速云服务器怎么用的

GPU云服务器租用费用贵吗

《CST Studio Suite 2024 GPU加速计算指南》

GPU云服务器租用多少钱

如何构建及优化GPU云网络

AMD与NVIDIA GPU优缺点

GPU加速计算平台是什么

亚马逊云科技宣布Amazon EC2 P5e实例正式可用由英伟达H200 GPU提供支持

GPU云服务器架构解析及应用优势

暴涨预警！NVIDIA GPU供应大跳水

NVIDIA全面转向开源GPU内核模块

恒讯科技的GPU云解决方案有什么特点和优势？

新手小白怎么学GPU云服务器跑深度学习?

FPGA在深度学习应用中或将取代GPU

搜索历史

首个采用NVIDIA M2050 GPU的实例 开启GPU云计算下个十年

评论

首个采用NVIDIA M2050 GPU的实例开启GPU云计算下个十年