0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过稀疏性支持和变压器优化增强AI推理

星星科技指导员 来源:嵌入式计算设计 作者:Saumitra Jagdale 2022-10-18 09:32 次阅读

英伟达张量RT 8 概述

NVIDIA 张量RT 是一个高性能推理平台,对于利用 NVIDIA 张量核心 GPU 的强大功能至关重要。TensorRT 8 是一个具有增强功能的软件开发工具包,旨在提高性能和准确性,以应对边缘和嵌入式设备中发生的越来越多的 AI 推理。它允许对张量流和PyTorch神经网络进行广泛的计算推断。

与仅 CPU 平台相比,TensorRT 可提供高达 40 倍的吞吐量,同时最大限度地减少延迟。它允许您从任何框架开始,并在生产中快速优化、验证和部署经过训练的神经网络。

新版本在 NVIDIA 安培 GPU 上集成了稀疏性,可修剪对网络整体计算无贡献的弱连接。此外,张量RT 8 支持变压器优化和 BERT 大。变压器优化可提高性能,而量化感知训练可提高准确性。

英伟达的张量RT 8 有什么新功能?

推理的目的是在训练阶段尽可能多地保持准确性。训练的模型可以在硬件设备上运行,以获得客户的最低响应时间和最大的吞吐量。但是,尽可能精确的必要性有时可能与边缘可用的内存量和吞吐量发生冲突。训练有素、高度准确的模型可能运行速度太慢。

因此,TensorRT版本8结合了深度学习推理或训练的神经网络模型应用的最新进展,以理解数据如何影响响应。它使用两个主要功能将语言查询推理时间减少一半:

英伟达安培架构的稀疏性

深度神经网络擅长各种任务,如计算机视觉语音识别和自然语言处理。随着处理这些神经网络所需的计算能力的增加,高效的建模和计算变得越来越重要。

稀疏是采用 NVIDIA 安培架构的 GPU 的一种全新性能方法,通过减少计算流程来提高开发人员的效率。深度学习模型的其他方面不如其他方面重要,有些甚至可能为零。因此,神经网络不需要对特定权重或参数进行计算。因此,NVIDIA 可以通过使用稀疏性将模型的权重减少近一半来增强性能、吞吐量和延迟。

通过变压器优化减少推理计算

在张量RT 8中,性能增强是通过变压器优化实现的。量化开发人员可以利用训练的模型通过 8 位计算 (INT8) 执行推理。这大大减少了张量核心中的推理计算和存储。INT8 越来越多地用于优化机器学习框架,如张量流和 NVIDIA 的张量压缩包,以减少内存和计算需求。因此,NVIDIA可以在张量RT 8上提供非常高的性能,同时保持准确性。

例如,量化感知训练 (QAT) 有可能将准确性提高一倍。因此,与旧版本张量RT 7相比,张量RT 8可以将许多模型的性能提高一倍。

张量RT部署在众多行业中

TensorRT更好的性能和准确性使其成为医疗保健,汽车,互联网/电信服务,金融服务和零售等行业的热门选择。例如,张量RT用于为GE医疗保健的心血管超声系统提供动力。数字诊断解决方案提供商使用该技术在其 Vivid E95 扫描器上加速了自动心脏视图检测。心脏病专家可以通过使用改进的视图检测算法,在早期阶段做出更准确的诊断和检测疾病。此外,TensorRT还被Verizon,福特,美国邮政服务,美国运通和其他知名公司使用。

随着张量RT 8的发布,NVIDIA还推出了使用张量RT的Google BERT大推理的突破,来自变形金刚的双向编码器表示(BERT)是一种基于变压器的机器学习技术,用于预训练自然语言处理。BERT-Large 模型只需 1.2 毫秒进行分析,从而可以实时响应自然语言查询。这意味着公司可以将其模型的尺寸增加一倍或三倍,以提高准确性。

像 BERT-Large 这样的语言模型被许多推理服务在幕后使用。另一方面,基于语言的应用程序通常无法识别细微差别或情感,从而导致整体糟糕的体验。现在,公司可以使用张量RT 8在几毫秒内部署整个工作流程。这些突破可以为新一代对话式AI应用程序铺平道路,为用户提供更智能、更低的延迟体验。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    27461

    浏览量

    265130
  • 变压器
    +关注

    关注

    0

    文章

    937

    浏览量

    4010
收藏 人收藏

    评论

    相关推荐

    干式变压器和油浸式变压器常见问题

    途?   干式变压器鸿蒙电力   干式电力变压器传统上用于建筑物中的低压和中压应用。改进的安全使得干式变压器成为室内配电的推荐。然而,这些系统有一些缺点和限制。   3、干式和油式
    发表于 05-28 10:44

    AI推理框架软件ONNX Runtime正式支持龙架构

    近日,知名AI推理框架开源社区ONNX Runtime正式发布支持龙架构的版本1.17.0。
    的头像 发表于 03-12 12:23 342次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>框架软件ONNX Runtime正式<b class='flag-5'>支持</b>龙架构

    变压器油的作用与用途 变压器油的闪点是多少

    变压器油是一种用于绝缘和冷却变压器的特殊液体。它在变压器运行过程中起着至关重要的作用。本文将详细阐述变压器油的作用与用途。 首先,变压器油的
    的头像 发表于 02-18 11:16 1742次阅读

    降压变压器可以作为升压变压器使用吗?

    降压变压器可以作为升压变压器使用吗? 变压器是电力系统中常见的设备,用于改变交流电压的大小。在变压器中,降压变压器和升压
    的头像 发表于 02-01 15:32 1037次阅读

    干式变压器和油浸变压器区别及优缺点

    干式变压器和油浸变压器在结构上存在明显的区别。干式变压器的铁芯和线圈都置于外部的空气中,通过自然通风或强制风冷来散热。而油浸变压器将线圈和
    的头像 发表于 01-17 09:50 1319次阅读

    定制变压器必须要知道的关键点

    更加精准的电流、电压等参数,保证设备的可靠和高效。 三、定制变压器的流程和注意事项 1.需求交流:客户需提供详细的使用场景,包括使用环境、电路参数等信息,以确定变压器的具体要求,同
    发表于 01-09 14:26

    什么是变压器铜损和铁损?变压器的铁损与铜损的区别是什么呢?

    什么是变压器铜损和铁损?变压器的铁损与铜损的区别是什么呢? 变压器是电能的重要传输和分配设备,其工作原理是通过互感作用将输入电压变换为输出电压。在
    的头像 发表于 12-29 11:11 2203次阅读

    高频变压器与低频变压器的区别?

    高频变压器与低频变压器的区别? 高频变压器与低频变压器是根据工作频率的不同而区分的。变压器是电力系统中常用的电力变换设备,它
    的头像 发表于 11-30 11:43 1039次阅读

    变压器的油浸式和干式指的是什么?

    为绝缘油,并通过油将变压器内部的线圈和绝缘材料浸泡在油中。油浸式变压器的冷却方式通常是通过油将变压器内部的热量传递到外部的散热器上,再
    的头像 发表于 11-23 14:38 1143次阅读

    工频变压器与高频变压器区别

    工频变压器与高频变压器区别  工频变压器与高频变压器是电力和电子领域中常见的两种变压器类型。虽然它们的基本工作原理相似,都是
    的头像 发表于 11-20 15:07 2202次阅读

    变压器技术攻略

    变压器几乎在所有的电子产品中都要用到,它原理简单,但根据不同的使用场合(不同的用途)变压器的绕制工艺会有所不同的要求。变压器的功能主要有:电压变换、阻抗变换、隔离、稳压(磁饱和变压器)
    发表于 09-28 06:31

    变压器如何增容?变压器增容要换什么?

    变压器如何增容?变压器增容要换什么?  变压器增容是指在不更换原有变压器的情况下,通过一些方法提高变压器
    的头像 发表于 08-31 15:52 5046次阅读

    变压器的电阻和电抗如何计算?移动变压器电阻电抗值

    影响变压器的工作效率和传输能力。因此,在设计和运行变压器时,需要计算变压器的电阻和电感,以便更好地进行控制和优化。 一、变压器的电阻计算
    的头像 发表于 08-23 17:26 4779次阅读

    变压器烧毁的原因有哪些?预防变压器烧坏的措施有哪些?

    的随意和管理上的不到位,造成了变压器的负荷偏相运行。长期的使用,致使某相线圈绝缘老化而烧 毁变压器。 (4) 分接开关接触不良: ①私自调节分接开关,造成配变分接开关不到位,接触不良而烧毁; ②分接开关
    发表于 07-31 14:58

    一种增强变压器电源电路设计

    在这篇文章中,我们将讨论一种增强变压器电源电路设计,该电路设计由一个稳定和稳压良好的直流级以及一个通过外部脉冲工作的继电器驱动器级组成。
    的头像 发表于 07-12 14:33 366次阅读
    一种<b class='flag-5'>增强</b>型<b class='flag-5'>变压器</b>电源电路设计