NVIDIA GPU计算的关键技术解析 - 全文

　　1999年，NVIDIA推出了首款图形处理器(GPU)，它是迄今为止使用最广的并行处理器。源于对逼真及实时图像的渴求，GPU已成为既可以浮点运算又可以编程的处理器;如今的GPU在计算吞吐量和内存带宽上远优于CPU，使其成为加速数据并行应用程序的理想处理器。

　　2003年起，NVIDIA开始对GPU进行非图形应用程序方面的探索。通过使用高级图形语言如DirectX、OpenGL和Cg，将各种数据并行算法移植于GPU。像蛋白质折叠、股票期权定价、SQL查询及MRI重建等问题都能通过GPU获得非凡的加速表现。这些早期将图形API用于通用计算的尝试被我们称为GPGPU程序。

　　虽然GPGPU模型显示出不俗的加速性能，但依旧面临诸多问题。首先，它要求程序员具备有关图形API以及GPU架构的相关知识。其次，问题必须按照顶点坐标、纹理及着色程序的方式表达出来，极大地增加了程序的复杂性。第三，不支持诸如随机读写内存等基础的编程特性，大大限制了编程模型。最后，缺少对双精度运算的支持(直到最近)意味著有些科学应用程序不能运行在GPU上。

　　为解决这些问题，NVIDIA采用了两项关键技术——G80统一图形与计算架构(最先采用于GeForce 8800、Quadro FX 5600与Tesla C870 GPU)和CUDA。CUDA作为一种软硬件架构，可采用多种高级编程语言对GPU进行编程。同时，这两种技术也代表着一种新的GPU应用方式。相比以前通过编程将专业图形单元与图形API结合不同，程序员可通过CUDA扩展来编写C语言程序，针对通用的大规模并行处理器。我们把这种新型GPU编程模式称之为“GPU计算”，它意味着更广泛的应用程序支持，更多编程语言的支持，是与初期GPGPU编程模型的本质分离。

　　G80架构

　　NVIDIA旗下GeForce 8800是被赋予了新型GPU计算模型的产品。2006年11月推出，基于GeForce 8800的G80为GPU计算所带来了的是一些关键性的创新：

　　G80是首款支持C语言的GPU，允许程序员使用GPU所带来的计算力，而又无须再学习一门新的编程语言。

　　G80是首款以单个、统一处理器取代顶点与像素管线的GPU，这种处理器可以执行顶点、几何、像素及计算程序。

　　G80是首款利用标量线程处理器的GPU，从而消除了程序员手动管理向量寄存器。

　　G80采用了单指令、多线程(SIMT)的执行模型，多个相互独立的线程可并行执行单条指令。

　　G80对内部线程通讯采用了共享内存和栅障同步。

　　2008年6月，NVIDIA对G80架构进行了重大改进。第二代统一架构——GT200(首次采用是在GeForce GTX 280，Quadro FX5800 和Tesla T10 GPU上)——将流处理器的核心数量(以下称其为 CUDA核心)从128增加至240。每个处理器的寄存器组都扩大了一倍，允许更多的线程任何时候在芯片上执行。增加硬件内存的联合存取以改善内存访问效率。另外，还添加了对双精度浮点运算的支持，以处理科学和高性能计算(HPC)应用。

　　在设计每款新一代GPU时，NVIDIA都以改善现有应用性能与GPU可编程性为宗旨;更快速的应用性将能带来直接的效益，GPU在可编程性上的不断进步，使得它发展成为我们当下最通用的并行处理器。正是基于这样的理念，促使我们又着手研发GT200架构的继任者。

　　NVIDIA的下一代CUDA计算与图形框架Fermi

　　从最初的G80起，Fermi架构在GPU架构上做出了最重大的飞跃。G80是统一图形与计算并行处理器的雏形，而GT200是对G80在性能及功能性方面的延伸。对于Fermi，我们融入了上两款处理器以及为它们编写应用程序中所获得的经验，应用了一种全新的方法，设计和创造出世界上第一款计算型GPU。在Fermi的研发准备过程中，我们收集了自推出G80和GT200以来广泛使用GPU计算的用户的反馈，并将以下关键领域作为改进重点：

　　改善双精度浮点运算的性能——单精度的性能大约是台式CPU的10倍，而有些GPU计算应用程序还需要更高的双精度浮点运算性能。

　　ECC支持——ECC允许GPU计算用户在数据中心的安装中安全地部署大规模的GPU，并确保数据敏感型应用程序，如医学影像及财务期权定价等不出现内存错误。

　　真正的缓存层次——有些并行算法无法使用GPU的共享内存，用户需要一个真正的缓存架构来辅助他们。

　　更大的共享内存——许多CUDA程序员需要超过16KB的SM共享内存来加速他们的应用程序。

　　更快速的上下文转换——用户需要在应用程序之间实现更快速的上下文切换，和图形与计算应用之间更快速的相互操作。

　　更快速的原子操作——用户需要为他们的并行算法实现更快速的“读-修改-写”原子操作。

　　针对这些需求，Fermi工作小组设计了一款处理器，原始计算力得到了极大的提升，通过架构上的创新还大大增加了可编程性以及计算效率。Fermi在架构上的闪光点体现在：

　　第三代流式多处理器(SM)

　　每个SM有32个CUDA核心，是GT200的4倍

　　双精度浮点运算的峰值性能是GT200的8倍

　　双Warp调度器同时调度和分配来自两个不同warp的指令

　　64 KB的RAM，可配置为共享存储器和L1缓存

　　第二代并行线程执行ISA

　　统一寻址空间，提供完整的C++支持

　　优化OpenCL和DirectCompute

　　完整的IEEE 754-2008 32-bit和64-bit精度支持

　　完整的32-bit整数路径，以及64-bit扩展

　　内存存取指令支持向64-bit寻址的转换

　　通过Predication提升性能

　　改进的内存子系统

　　NVIDIA Parallel DataCacheTM层次，拥有可配置的L1和统一的L2缓存

　　首款提供ECC内存支持的GPU

　　显著改善原子内存操作性能

　　NVIDIA GigaThreadTM Engine

　　相比早先产品10倍以上的应用程序上下文切换

　　同步执行多核心程序

　　线程块乱序执行

　　双重叠式内存传输引擎

阅读全文

上一页 1 2全文

本文导航

第 1 页：NVIDIA GPU计算的关键技术解析
第 2 页：下一代CUDA计算与图形框架Fermi

NVIDIA(101457) NVIDIA(101457)
gpu(126253) gpu(126253)

4G移动通信关键技术及特征是什么？

4G移动通信关键技术及特征是什么？

2021-05-26 06:37:46

4G移动通信是什么？4G中有哪些关键技术？

4G移动通信是什么？4G中有哪些关键技术？

2021-05-27 06:17:27

4G移动通信系统的主要特点和关键技术有哪些？

4G移动通信系统的主要特点是什么？4G移动通信系统的关键技术有哪些？

2021-05-27 06:51:33

5G关键技术从Massive MIMO开始

2021-05-21 06:03:25

5G承载网到底有哪些关键技术？

5G承载网的整体分层结构5G承载网关键技术

2021-03-02 06:23:25

NVIDIA Tesla K20C K20M K20X 并行计算GPU

``提供个人超级计算机解决方案　　高性能GPU运算服务器解决方案/集群解决方案　　Nvidia Tesla C2050 CUDA核心频率：1.15 GHz CUDA核心数量：448　　双精度浮点性能

2014-08-03 18:09:13

NVIDIA Tesla K20C K20M 高精密并行计算GPU

`Nvidia TeslaK10GPU 的数量和类型:2 Kepler GK104sCUDA核心数量：3072(每颗 GPU 1536 个)双精度浮点性能：190 Gigaflops(每颗 GPU

2015-02-05 16:14:28

NVIDIA Tesla K40C K40M 高精密并行计算GPU

&quot; 14000 一年质保工业包装现货 Nvidia TeslaK10 &quot;GPU 的数量和类型:2 Kepler GK104sCUDA核心

2014-09-02 21:17:41

NVIDIA Tesla K80 全球最快并行计算GPU 盒包正品、质保三年

Nvidia TeslaK10GPU 的数量和类型:2 Kepler GK104sCUDA核心数量：3072(每颗 GPU 1536 个)双精度浮点性能：190 Gigaflops(每颗 GPU

2015-01-19 16:53:59

NVIDIA-SMI：监控GPU的绝佳起点

nvidia-smi可执行文件位于虚拟机管理程序上。如果在同一部署中您选择在GPU上使用作为传递，那么GPU正在寻找访客上的NVIDIA驱动程序，因此nvidia-smi位于访客上。以上来自于谷歌翻译以下为原文

2018-09-04 15:18:02

NVIDIA火热招聘GPU高性能计算架构师

这边是NVIDIA HR Allen, 我们目前在上海招聘GPU高性能计算架构师(功能验证)的岗位，有意向的朋友欢迎发送简历到 allelin@nvidia

2017-09-01 17:22:28

NVIDIA网格GPU-PSOD的支持结构

they blamed it on the nvidia gpu but they dont know if its a driver or hardware issue.Can a ticket be open

2018-10-10 16:15:55

Nvidia GPU风扇和电源显示ERR怎么解决

问题最近在Ubuntu上使用Nvidia GPU训练模型的时候，如果机器锁屏一段时间再打开的时候鼠标非常卡顿，或者说显示界面非常卡顿，使用nvidia-smi查看发现，训练模型的GPU没有问题，但是

2021-12-30 06:44:30

ASON网络关键技术有哪些？

ASON光网络由哪几部分组成？ASON网络关键技术有哪些？ASON的亮点是什么？

2021-05-28 06:48:08

CDMA原理与关键技术

CDMA原理与关键技术

2012-08-16 20:25:45

CatM的关键技术有哪些？CatNB和CatM有什么区别？

物联网市场的网络特性是什么？CatNB和CatM有什么区别？CatM的关键技术有哪些？

2021-06-30 08:02:29

DDRx的关键技术介绍（中）

在DDRx里面经常会被一些缩写误扰，如OCD、OCT和ODT，我想有同样困扰的大有人在，今天还是继续上一篇的关键技术来介绍一下大家的这些困扰吧。片外驱动调校OCD（Off-Chip Driver

2016-08-31 11:36:41

GPS芯片的关键技术是什么

谈到GPS芯片主要关键技术，这包括负责讯号处理─基频（Baseband）及接收讯号─射频（RF）。由于GPS讯号频率（1,575.42MHz）来自于距离地面2万公里的高空，讯号十分不稳定，因此当天

2019-07-30 06:52:50

LCD显示的关键技术

可以用硬件电路或软件程序实现B．只能用滤波电路或双稳态电路实现C．只能用软件程序实现D．只能用延时程序实现2.LCD显示的关键技术是解决驱动问题，正确的作法是(D)。A．采用固定的交流电压驱动B．采用直流电...

2021-09-10 08:39:03

LTE-Advanced的关键技术和标准进展介绍

）等关键技术，能大大提高无线通信系统的峰值数据速率、峰值谱效率、小区平均谱效率以及小区边界用户性能，同时也能提高整个网络的组网效率，这使得LTE和LTE-A系统成为未来几年内无线通信发展的主流，本文将对这些关键技术及其标准进展进行介绍。

2019-06-14 06:41:50

MIMO-OFDM中有哪些关键技术？

本文介绍了MIMO-OFDM技术中的关键技术，如信道估计、同步、分集技术和空时编码等。

2021-05-27 06:05:59

McWiLL系统的关键技术/优势及应用

McWiLL系统概述McWiLL系统的关键技术McWiLL系统的优势McWiLL系统的应用

2020-11-24 06:57:16

POE供电的技术优势和关键技术

什么是POE供电？POE供电的技术优势和拓展应用POE以太网供电的关键技术

2020-12-24 07:00:59

POE的关键技术有哪些？

使用以太网线供电的优势是什么？PoE设备是怎么供电的？POE的关键技术有哪些？

2021-06-10 09:26:50

RS485转以太网的应用是什么？有哪些关键技术？

RS485转以太网的应用是什么？RS485转以太网的解决方案是什么？RS485转以太网有哪些关键技术？

2021-05-27 06:14:04

VR一体机技术的关键技术

支持• HDMI、3路MIPI CSI、双路MIPI DSI等众多丰富的接口扩展图2 基于业界领先处理器的核心计算模块图3 Qaulcomm 一体机产品四.关键技术介绍：1.视觉：1.1.畸变矫正，色散

2018-09-21 10:51:27

WCDMA中的关键技术在网络规划中的应用是什么

WCDMA中的关键技术在网络规划中的应用是什么

2021-05-27 06:15:01

【技术系列】浅谈GPU虚拟化技术（第一章）

摘要： GPU深度好文系列，阿里云技术专家分享第一章GPU虚拟化发展史GPU的虚拟化发展历程事实上与公有云市场和云计算应用场景的普及息息相关。如果在10年前谈起云计算，大部分人的反应是“不知所云

2018-04-16 10:51:32

【视频】智能家居系统关键技术分析与应用

视频主题：智能家居系统关键技术分析与应用视频主讲：易老师，华清远见金牌讲师。视频简介：主讲：易老师，华清远见金牌讲师。课程内容：1 智能家居起源及概念；2 智能家居应用现状；3 智能家居与物联网

2016-02-26 10:50:43

二三层桥接为何是LTE承载的关键技术？

二三层桥接为何是LTE承载的关键技术？

2021-05-24 07:17:37

云计算关键技术及标准化是什么

分析了云计算关键的技术，包括虚拟化/分布式文件系统/分布式数据库等，介绍了相关云方案实现，并对云计算在IETF/ITU等标准组织的最新研究竞争做了说明。

2021-06-07 06:50:19

什么是5G高频关键技术？

5G技术方兴未艾，各种候选技术获得业界的广泛关注。本文结合高频技术在5G中的应用场景和关键技术，介绍了爱立信开发的5G高频无线空口测试床，分享了在中国5G技术研发试验第一阶段的测试结果，分析并总结了5G高频技术的出色表现。

2019-08-16 07:27:48

什么是HarmonyOS？鸿蒙OS架构及关键技术是什么？

什么是HarmonyOS？鸿蒙OS架构及关键技术是什么？

2021-09-23 09:02:48

利用CAN总线构建一个车内网络，需要解决的关键技术问题有哪些？

CAN-BUS系统主要包括哪些部件？车载网络的应用分类有哪几种？利用CAN总线构建一个车内网络，需要解决的关键技术问题有哪些？

2021-05-13 06:07:54

印制电路板制造的关键技术有哪些

`请问印制电路板制造的关键技术有哪些？`

2020-01-13 16:30:35

在Ubuntu上使用Nvidia GPU训练模型

问题最近在Ubuntu上使用Nvidia GPU训练模型的时候，没有问题，过一会再训练出现非常卡顿，使用nvidia-smi查看发现，显示GPU的风扇和电源报错：解决方案自动风扇控制在nvidia

2022-01-03 08:24:09

基于嵌入式视频的多媒体集控系统实现的关键技术是什么？

基于嵌入式视频的多媒体集控系统实现的体系结构基于嵌入式视频的多媒体集控系统实现的关键技术

2021-06-04 07:15:37

多核DSP关键技术及其应用有哪些？

多核DSP关键技术有哪些？多核DSP的应用有哪些？主流多核DSP介绍

2021-04-21 06:10:10

嵌入式实时系统的关键技术是什么？

作为崭新的、面向应用的计算机系统，嵌入式系统在集成了通用计算机系统的共性以外，还包含了很多适合“嵌入式”应用的新技术;因为在技术上与通用计算机系统有很多不同，本文首先介绍嵌入式系统的基本概念及其关键技术，并结合在通信系统中的应用说明其技术特点及可应用性。

2019-08-14 07:43:34

嵌入式系统关键技术分析与开发应用

嵌入式系统关键技术分析与开发应用

2012-08-09 00:29:48

工业物联网是如何定义的？工业物联网的关键技术主要包含哪几个方面？

工业物联网是如何定义的？工业物联网的关键技术主要包含哪几个方面？物联网的工业应用主要在哪些方面？

2021-06-16 07:55:10

数字家庭网络的关键技术是什么？

数字家庭网络提供的业务类别以及需求有哪些？数字家庭网络的关键技术是什么？

2021-05-26 06:20:16

新一代视频编码标准H,264/AVC有哪几种关键技术？

新一代视频编码标准H,264/AVC有哪几种关键技术？

2021-06-03 06:33:58

无人驾驶分级及关键技术

无人驾驶分级无人驾驶汽车关键技术

2021-01-21 07:13:47

无人驾驶汽车的关键技术是什么？

无人驾驶汽车开发的关键技术主要有两个方面:车辆定位和车辆控制技术。这两方面相辅相成共同构成无人驾驶汽车的基础。

2020-03-18 09:02:01

明白VPP关键技术有哪些

随着人工智能技术的不断发展，越来越多的行业开始使用人工智能技术，这也使得智能虚拟代理技术得到了广泛的应用。为了能够深入了解智能虚拟代理技术，需要明白VPP关键技术有哪些。深入了解VPP关键技术有

2021-08-31 07:28:16

智能导航系统建设意义是什么？关键技术有哪些？

智能导航系统建设意义是什么？智能导航系统中的关键技术有哪些？智能导航系统在CDMA无线数据中的应用是什么？

2021-05-27 06:57:38

智能穿戴产业的五大关键技术

个过程中，有五大关键技术将决定着智能穿戴产业发展的进程和方向。一、人机交互技术在物联网时代，当人成为“万物”控制的中心时，人“机”之间的“沟通”方式也将随即发生变化。着眼于直接、便捷的交互相求，一种

2019-05-09 06:20:34

智能网联汽车的关键技术

2021-07-27 06:31:46

智能通信终端有哪些关键技术？

智能通信终端有哪些关键技术？

2021-05-26 07:04:20

汽车总线及其关键技术的研究

汽车总线及其关键技术的研究

2012-07-10 11:33:28

物联网关键技术及其发展

物联网关键技术及其发展

2012-08-14 00:19:20

物联网的关键技术有哪些

物联网关键技术————传感器技术

2020-06-16 17:25:07

物联网网关是什么？物联网网关关键技术有哪些？

物联网网关是什么？物联网网关的形态物联网网关关键技术有哪些？物联网网关应用方向及实例

2021-04-19 10:03:11

直升机卫星通信系统关键技术有哪些？

本文从直升机卫星通信系统的关键技术入手，结合工程应用把问题一一展开。通过对系统全面的了解，对关键技术的确认，从而实现对系统的准确测试。

2021-05-21 06:48:52

第四代移动通信系统有哪些关键技术？

第四代移动通信技术是什么？有什么主要特点？第四代移动通信系统有哪些关键技术？

2021-05-26 07:07:28

视觉导航关键技术及应用

由于视觉导航技术的应用越来越普及 ,因此 ,有必要对视觉导航中的关键技术及应用进行研究。文章对其中的图像处理技术和定位与跟踪技术进行了详细研究 ,并与此相对应 ,介绍的相关的应用。

2023-09-25 08:09:38

让机器人实现智能的关键技术到底是什么？

让机器人实现智能的关键技术到底是什么？这些技术在最近十年会发展到什么程度？整个产业的应用前景将会如何？

2021-07-05 06:55:38

设计高稳定行运算放大器电路的关键技术有哪些？

设计高稳定行运算放大器电路的关键技术常用的稳定运算放大电路方法

2021-04-06 06:56:37

详解5G的六大关键技术

过程中会遇到哪些问题？在5G研发刚起步的情况下，如何建立一套全面的5G关键技术评估指标体系和评估方法，实现客观有效的第三方评估，服务技术与资源管理的发展需要，同样是当前5G技术发展所面临的重要问题

2017-12-07 18:40:58

请问一下LTE有哪些关键技术？

LTE有哪些关键技术？

2021-05-21 06:14:07

购买哪款Nvidia GPU

。Nvidia的NV 24核，224 GB RAM，1.4 GB临时存储。这是相当昂贵的（每月费用超过3,400美元），除非我承诺1年或3年的承诺，略有减少。我认为如果我购买GPU服务器，从长远来看可能会更便

2018-09-26 15:30:46

超宽带认知无线电的关键技术是什么？

本文从超宽带认知无线电适配信号的产生、功率传输控制和分布式节点间的合作三个方面，对当前该技术领域的关键技术进行了详细的介绍和分析。

2021-05-26 06:51:23

车载移动异构无线网络架构及关键技术是什么？

车载移动异构无线网络架构及关键技术是什么？

2021-06-07 06:29:57

鲲鹏920芯片是布局云端计算的关键技术

华为推出鲲鹏920芯片：布局云端计算的关键技术之一

2021-01-25 07:05:35

泰尔实验室：HSPA关键技术解析

泰尔实验室：HSPA关键技术解析 HSPA的全称为高速分组接入(high speed packet access)，它是高速下行分组接入HSDPA(high speed do

2009-06-01 18:39:56

1368

PCB抄板软件之POWERPCB关键技术解析

PCB抄板软件之POWERPCB关键技术解析在PCB抄板领域，传统的抄板还是选用PROTEL99作为抄板软件，但是，随着电路板技术的不断升级，电路板密度越来越高、越来越复

2010-01-23 11:34:08

1159

工业以太网协议与应用关键技术

本文介绍Ethernet应用于工业现场的几种关键技术与注意事项，工业以太网相关协议解析、工业以太网技术优势。

2012-12-17 11:25:17

2008

云计算关键技术与研究问题

本文为你介绍部分具有挑战性云计算关键技术及其研究问题，具体包括如，虚拟机迁移、服务器整合、能耗管理、流量管理与分析、MapReduce软件框架、存储技术、数据管理等多个方面。

2013-01-29 15:19:56

921

云计算的体系结构域关键技术_李凌霞

云计算的体系结构域关键技术_李凌霞

2017-03-20 09:21:51

NVIDIA GPU加速计算之路

NVIDIA从提出GPU以及CUDA核心开始，NVIDIA便开始逐步迈出游戏圈，不断向全新的计算领域发起攻势。时至今日，NVIDIA GPU计算从机器人、自动驾驶，一路扩展到云计算、医疗甚至是NASA火星登录计划。

2019-12-23 09:12:33

6930

NVIDIA介绍NVIDIA Ampere架构的NVIDIA A100 GPU技术

兼首席执行官黄仁勋在其加州住宅的厨房中录制的六集同时发布的主题演讲中，介绍了NVIDIA最近对Mellanox的收购，还有重盼所归的基于NVIDIA Ampere GPU架构的新产品以及重要的最新软件技术。这场主题演讲原计划于3月底在圣何塞举行的NVIDIA GPU技术大会上现场直播，但因冠状病

2020-10-08 00:56:00

4871

NVIDIA GPU加快深度神经网络训练和推断

深度学习是推动当前人工智能大趋势的关键技术。在 MATLAB 中可以实现深度学习的数据准备、网络设计、训练和部署全流程开发和应用。联合高性能 NVIDIA GPU 加快深度神经网络训练和推断。

2022-02-18 13:31:44

1714

已全部加载完成

搜索历史

NVIDIA GPU计算的关键技术解析 - 全文

本文导航

评论