通过稀疏性支持和变压器优化增强AI推理-电子发烧友网

英伟达张量RT 8 概述

NVIDIA 张量RT 是一个高性能推理平台，对于利用 NVIDIA 张量核心 GPU 的强大功能至关重要。TensorRT 8 是一个具有增强功能的软件开发工具包，旨在提高性能和准确性，以应对边缘和嵌入式设备中发生的越来越多的 AI 推理。它允许对张量流和PyTorch神经网络进行广泛的计算推断。

与仅 CPU 平台相比，TensorRT 可提供高达 40 倍的吞吐量，同时最大限度地减少延迟。它允许您从任何框架开始，并在生产中快速优化、验证和部署经过训练的神经网络。

新版本在 NVIDIA 安培 GPU 上集成了稀疏性，可修剪对网络整体计算无贡献的弱连接。此外，张量RT 8 支持变压器优化和 BERT 大。变压器优化可提高性能，而量化感知训练可提高准确性。

英伟达的张量RT 8 有什么新功能？

推理的目的是在训练阶段尽可能多地保持准确性。训练的模型可以在硬件设备上运行，以获得客户的最低响应时间和最大的吞吐量。但是，尽可能精确的必要性有时可能与边缘可用的内存量和吞吐量发生冲突。训练有素、高度准确的模型可能运行速度太慢。

因此，TensorRT版本8结合了深度学习推理或训练的神经网络模型应用的最新进展，以理解数据如何影响响应。它使用两个主要功能将语言查询推理时间减少一半：

英伟达安培架构的稀疏性

深度神经网络擅长各种任务，如计算机视觉、语音识别和自然语言处理。随着处理这些神经网络所需的计算能力的增加，高效的建模和计算变得越来越重要。

稀疏是采用 NVIDIA 安培架构的 GPU 的一种全新性能方法，通过减少计算流程来提高开发人员的效率。深度学习模型的其他方面不如其他方面重要，有些甚至可能为零。因此，神经网络不需要对特定权重或参数进行计算。因此，NVIDIA 可以通过使用稀疏性将模型的权重减少近一半来增强性能、吞吐量和延迟。

通过变压器优化减少推理计算

在张量RT 8中，性能增强是通过变压器优化实现的。量化开发人员可以利用训练的模型通过 8 位计算（INT8）执行推理。这大大减少了张量核心中的推理计算和存储。INT8 越来越多地用于优化机器学习框架，如张量流和 NVIDIA 的张量压缩包，以减少内存和计算需求。因此，NVIDIA可以在张量RT 8上提供非常高的性能，同时保持准确性。

例如，量化感知训练（QAT）有可能将准确性提高一倍。因此，与旧版本张量RT 7相比，张量RT 8可以将许多模型的性能提高一倍。

张量RT部署在众多行业中

TensorRT更好的性能和准确性使其成为医疗保健，汽车，互联网/电信服务，金融服务和零售等行业的热门选择。例如，张量RT用于为GE医疗保健的心血管超声系统提供动力。数字诊断解决方案提供商使用该技术在其 Vivid E95 扫描器上加速了自动心脏视图检测。心脏病专家可以通过使用改进的视图检测算法，在早期阶段做出更准确的诊断和检测疾病。此外，TensorRT还被Verizon，福特，美国邮政服务，美国运通和其他知名公司使用。

随着张量RT 8的发布，NVIDIA还推出了使用张量RT的Google BERT大推理的突破，来自变形金刚的双向编码器表示（BERT）是一种基于变压器的机器学习技术，用于预训练自然语言处理。BERT-Large 模型只需 1.2 毫秒进行分析，从而可以实时响应自然语言查询。这意味着公司可以将其模型的尺寸增加一倍或三倍，以提高准确性。

像 BERT-Large 这样的语言模型被许多推理服务在幕后使用。另一方面，基于语言的应用程序通常无法识别细微差别或情感，从而导致整体糟糕的体验。现在，公司可以使用张量RT 8在几毫秒内部署整个工作流程。这些突破可以为新一代对话式AI应用程序铺平道路，为用户提供更智能、更低的延迟体验。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31493

浏览量
270176
变压器

变压器

+关注

关注
0

文章
1152

浏览量
4010

自耦变压器的工作原理自耦变压器与隔离变压器的区别

变压器是电力系统中不可或缺的设备，它们用于改变电压等级，以满足不同用电设备的需求。在众多变压器类型中，自耦变压器和隔离变压器因其独特的工作原理和应用场景而备受关注。自耦

发表于 12-10 09:30 •585次阅读

如何增加变压器短路阻抗

增加变压器短路阻抗是提升变压器稳定性和安全性的重要措施。以下是一些增加变压器短路阻抗的方法：一、调整变压器参数增加绕组匝数：

发表于 10-08 16:06 •711次阅读

变压器铁芯的材料是什么性材料

作用是提供磁路，使得变压器的一次侧和二次侧之间能够通过磁场进行能量的传递。铁芯的磁导率和损耗特性直接影响变压器的效率和热稳定性。 2. 铁芯材料的基本要求 变压器铁芯的材料需要满足以下

发表于 09-29 14:54 •1835次阅读

选择干式变压器还是油浸式变压器？

变压器是从发电站直接获取高压电并将其转换为较低电压的常用设备。这使得只有在办公室、交通枢纽、学校和工厂等空间处理低压的机械和设备才能安全高效地使用能源。　　通过这个过程，变压器会产生大量的热量

发表于 09-18 11:08

高频功率变压器磁芯的作用

实现电能的转换和传输。在高频应用中，磁芯的磁导率和损耗特性对变压器的性能有显著影响。提高效率：通过优化磁芯材料和设计，可以减少能量损耗，提高变压器的效率。电磁兼容

发表于 09-07 10:40 •801次阅读

控制变压器的作用是什么

相似，但它们通常具有更高的绝缘等级和更严格的性能要求，以确保在各种恶劣环境下的可靠性和安全性。控制变压器的基本原理控制变压器的基本原理是基于电磁感应现象。当交流电流

发表于 09-06 14:17 •885次阅读

隔离变压器和控制变压器能通用吗

，并提供安全性和保护性。它还可以消除电磁干扰（EMI）和射频干扰（RFI），提高设备的性能和可靠性。隔离变压器的变压比通常是1:1，但也可以

发表于 09-06 11:28 •702次阅读

控制变压器是不是隔离变压器

设计的变压器，主要用于控制电路中，如电机启动、速度控制、照明控制等。它们通常具有较低的电压和电流输出，以适应控制电路的需求。 2. 工作原理控制变压器的工作原理基于电磁感应。当交流电通过初级线圈时，会在铁芯中产生交变磁通，

发表于 09-06 11:25 •824次阅读

自耦变压器和普通变压器的区别

、应用场景以及优缺点。 1. 工作原理普通变压器 ：普通变压器通常由两个或多个相互独立的线圈组成，即原边（一次侧）和副边（二次侧）。它们通过磁耦合的方式实现能量的传输。当原边线圈接入交流电源时，会在铁芯中产生交变磁通

发表于 08-07 10:37 •3329次阅读

变压器预防性试验项目及意义

。预防性试验通过对变压器各项性能指标的检测，能够及时发现并排除潜在的安全隐患，提高变压器的可靠性和安全性

发表于 08-01 13:51

有载变压器和无载变压器的区别有哪些

有载变压器和无载变压器是两种不同类型的变压器，它们在设计、操作和应用方面存在显著的差异。

发表于 05-10 16:06 •2596次阅读

变压器冷却器的工作原理 变压器冷却器的作用

变压器冷却器的工作原理 变压器冷却器的作用 变压器冷却器的工作原理是

发表于 03-08 15:26 •2825次阅读

高频变压器和脉冲变压器的区别

。高频变压器是一种将电能从一个电路传输到另一个电路的电力转换装置。它通过将输入电路中的电流通过磁耦合传输到输出电路中来改变电压或电流的大小。高频变压器主要用于电力传输、电子设备和通信

发表于 03-07 16:05 •1925次阅读

变压器油的作用与用途 变压器油的闪点是多少

防止电流通过，从而保护变压器内部的线圈和绝缘材料不受损坏。这是由于变压器油的高电阻率和绝缘性能，使得电流不能透过它而通过。此外，变压器油还可

发表于 02-18 11:16 •5734次阅读

干式变压器温度范围干式变压器与油浸变压器的优缺点

的设计和生产过程中根据材料耐温性能、散热条件等因素来确定，一般可在80-110摄氏度之间。干式变压器与油浸变压器的优缺点：安全性：干式变压器相比油浸

发表于 02-04 10:51 •4193次阅读

搜索历史

通过稀疏性支持和变压器优化增强AI推理

评论

自耦变压器的工作原理自耦变压器与隔离变压器的区别

如何增加变压器短路阻抗

变压器铁芯的材料是什么性材料

选择干式变压器还是油浸式变压器？

高频功率变压器磁芯的作用

控制变压器的作用是什么

隔离变压器和控制变压器能通用吗

控制变压器是不是隔离变压器

自耦变压器和普通变压器的区别

变压器预防性试验项目及意义

有载变压器和无载变压器的区别有哪些

变压器冷却器的工作原理变压器冷却器的作用

高频变压器和脉冲变压器的区别

变压器油的作用与用途变压器油的闪点是多少

干式变压器温度范围干式变压器与油浸变压器的优缺点