0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过稀疏性支持和变压器优化增强AI推理

星星科技指导员 来源:嵌入式计算设计 作者:Saumitra Jagdale 2022-10-18 09:32 次阅读

英伟达张量RT 8 概述

NVIDIA 张量RT 是一个高性能推理平台,对于利用 NVIDIA 张量核心 GPU 的强大功能至关重要。TensorRT 8 是一个具有增强功能的软件开发工具包,旨在提高性能和准确性,以应对边缘和嵌入式设备中发生的越来越多的 AI 推理。它允许对张量流和PyTorch神经网络进行广泛的计算推断。

与仅 CPU 平台相比,TensorRT 可提供高达 40 倍的吞吐量,同时最大限度地减少延迟。它允许您从任何框架开始,并在生产中快速优化、验证和部署经过训练的神经网络。

新版本在 NVIDIA 安培 GPU 上集成了稀疏性,可修剪对网络整体计算无贡献的弱连接。此外,张量RT 8 支持变压器优化和 BERT 大。变压器优化可提高性能,而量化感知训练可提高准确性。

英伟达的张量RT 8 有什么新功能?

推理的目的是在训练阶段尽可能多地保持准确性。训练的模型可以在硬件设备上运行,以获得客户的最低响应时间和最大的吞吐量。但是,尽可能精确的必要性有时可能与边缘可用的内存量和吞吐量发生冲突。训练有素、高度准确的模型可能运行速度太慢。

因此,TensorRT版本8结合了深度学习推理或训练的神经网络模型应用的最新进展,以理解数据如何影响响应。它使用两个主要功能将语言查询推理时间减少一半:

英伟达安培架构的稀疏性

深度神经网络擅长各种任务,如计算机视觉语音识别和自然语言处理。随着处理这些神经网络所需的计算能力的增加,高效的建模和计算变得越来越重要。

稀疏是采用 NVIDIA 安培架构的 GPU 的一种全新性能方法,通过减少计算流程来提高开发人员的效率。深度学习模型的其他方面不如其他方面重要,有些甚至可能为零。因此,神经网络不需要对特定权重或参数进行计算。因此,NVIDIA 可以通过使用稀疏性将模型的权重减少近一半来增强性能、吞吐量和延迟。

通过变压器优化减少推理计算

在张量RT 8中,性能增强是通过变压器优化实现的。量化开发人员可以利用训练的模型通过 8 位计算 (INT8) 执行推理。这大大减少了张量核心中的推理计算和存储。INT8 越来越多地用于优化机器学习框架,如张量流和 NVIDIA 的张量压缩包,以减少内存和计算需求。因此,NVIDIA可以在张量RT 8上提供非常高的性能,同时保持准确性。

例如,量化感知训练 (QAT) 有可能将准确性提高一倍。因此,与旧版本张量RT 7相比,张量RT 8可以将许多模型的性能提高一倍。

张量RT部署在众多行业中

TensorRT更好的性能和准确性使其成为医疗保健,汽车,互联网/电信服务,金融服务和零售等行业的热门选择。例如,张量RT用于为GE医疗保健的心血管超声系统提供动力。数字诊断解决方案提供商使用该技术在其 Vivid E95 扫描器上加速了自动心脏视图检测。心脏病专家可以通过使用改进的视图检测算法,在早期阶段做出更准确的诊断和检测疾病。此外,TensorRT还被Verizon,福特,美国邮政服务,美国运通和其他知名公司使用。

随着张量RT 8的发布,NVIDIA还推出了使用张量RT的Google BERT大推理的突破,来自变形金刚的双向编码器表示(BERT)是一种基于变压器的机器学习技术,用于预训练自然语言处理。BERT-Large 模型只需 1.2 毫秒进行分析,从而可以实时响应自然语言查询。这意味着公司可以将其模型的尺寸增加一倍或三倍,以提高准确性。

像 BERT-Large 这样的语言模型被许多推理服务在幕后使用。另一方面,基于语言的应用程序通常无法识别细微差别或情感,从而导致整体糟糕的体验。现在,公司可以使用张量RT 8在几毫秒内部署整个工作流程。这些突破可以为新一代对话式AI应用程序铺平道路,为用户提供更智能、更低的延迟体验。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268891
  • 变压器
    +关注

    关注

    0

    文章

    1126

    浏览量

    4010
收藏 人收藏

    评论

    相关推荐

    自耦变压器的工作原理 自耦变压器与隔离变压器的区别

    变压器是电力系统中不可或缺的设备,它们用于改变电压等级,以满足不同用电设备的需求。在众多变压器类型中,自耦变压器和隔离变压器因其独特的工作原理和应用场景而备受关注。 自耦
    的头像 发表于 12-10 09:30 209次阅读

    如何增加变压器短路阻抗

    增加变压器短路阻抗是提升变压器稳定性和安全的重要措施。以下是一些增加变压器短路阻抗的方法: 一、调整变压器参数 增加绕组匝数 :
    的头像 发表于 10-08 16:06 485次阅读

    变压器铁芯的材料是什么材料

    作用是提供磁路,使得变压器的一次侧和二次侧之间能够通过磁场进行能量的传递。铁芯的磁导率和损耗特性直接影响变压器的效率和热稳定性。 2. 铁芯材料的基本要求 变压器铁芯的材料需要满足以下
    的头像 发表于 09-29 14:54 1203次阅读

    选择干式变压器还是油浸式变压器

    变压器是从发电站直接获取高压电并将其转换为较低电压的常用设备。这使得只有在办公室、交通枢纽、学校和工厂等空间处理低压的机械和设备才能安全高效地使用能源。   通过这个过程,变压器会产生大量的热量
    发表于 09-18 11:08

    高频功率变压器磁芯的作用

    实现电能的转换和传输。在高频应用中,磁芯的磁导率和损耗特性对变压器的性能有显著影响。 提高效率 :通过优化磁芯材料和设计,可以减少能量损耗,提高变压器的效率。 电磁兼容
    的头像 发表于 09-07 10:40 568次阅读

    控制变压器的作用是什么

    相似,但它们通常具有更高的绝缘等级和更严格的性能要求,以确保在各种恶劣环境下的可靠和安全。 控制变压器的基本原理 控制变压器的基本原理是基于电磁感应现象。当交流电流
    的头像 发表于 09-06 14:17 577次阅读

    隔离变压器和控制变压器能通用吗

    ,并提供安全和保护。它还可以消除电磁干扰(EMI)和射频干扰(RFI),提高设备的性能和可靠。隔离变压器变压比通常是1:1,但也可以
    的头像 发表于 09-06 11:28 532次阅读

    控制变压器是不是隔离变压器

    设计的变压器,主要用于控制电路中,如电机启动、速度控制、照明控制等。它们通常具有较低的电压和电流输出,以适应控制电路的需求。 2. 工作原理 控制变压器的工作原理基于电磁感应。当交流电通过初级线圈时,会在铁芯中产生交变磁通,
    的头像 发表于 09-06 11:25 616次阅读

    变压器预防试验项目及意义

    。预防试验通过变压器各项性能指标的检测,能够及时发现并排除潜在的安全隐患,提高变压器的可靠和安全
    发表于 08-01 13:51

    高频变压器和脉冲变压器的区别

    。 高频变压器是一种将电能从一个电路传输到另一个电路的电力转换装置。它通过将输入电路中的电流通过磁耦合传输到输出电路中来改变电压或电流的大小。高频变压器主要用于电力传输、电子设备和通信
    的头像 发表于 03-07 16:05 1757次阅读

    变压器油的作用与用途 变压器油的闪点是多少

    防止电流通过,从而保护变压器内部的线圈和绝缘材料不受损坏。这是由于变压器油的高电阻率和绝缘性能,使得电流不能透过它而通过。此外,变压器油还可
    的头像 发表于 02-18 11:16 4940次阅读

    干式变压器温度范围 干式变压器与油浸变压器的优缺点

    的设计和生产过程中根据材料耐温性能、散热条件等因素来确定,一般可在80-110摄氏度之间。 干式变压器与油浸变压器的优缺点: 安全:干式变压器相比油浸
    的头像 发表于 02-04 10:51 4041次阅读

    接地变压器的原理及作用 接地变压器的介绍

    接地变压器是一种特殊的变压器,其主要作用是将电流回路的其中一端接地,从而保证电流回路的安全
    的头像 发表于 02-01 16:53 6178次阅读

    降压变压器可以作为升压变压器使用吗?

    ,而升压变压器通过增加输入电源的电压来提供较高的输出电压。然而,是否可以将降压变压器作为升压变压器使用,这是一个有趣的问题。本文将分析降压变压器
    的头像 发表于 02-01 15:32 2211次阅读

    在什么情况下应选择使用环形变压器而不是其他类型的变压器

    而不是其他类型的变压器。 首先,环形变压器在高频电磁干扰(EMI)和谐振的控制方面具有优势。由于其环形结构本身具有高度抗干扰能力,并且可以通过合适的屏蔽和绝缘措施进一步增强,环形
    的头像 发表于 01-30 16:18 552次阅读