0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

学习资源 | NVIDIA TensorRT 全新教程上线

NVIDIA英伟达 来源:未知 2023-08-04 17:45 次阅读

NVIDIA TensorRT是一个用于高效实现已训练好的深度学习模型推理过程的软件开发工具包,内含推理优化器和运行环境两部分,其目的在于让深度学习模型能够在 GPU 上以更高吞吐量和更低的延迟运行,目前已在业界得到广泛应用与部署。

为了帮助广大开发者更好地了解 TensorRT,NVIDIA GPU 计算专家团队(Devtech)工程师李玮、王猛基于最新的 8.6.1 版本录制了NVIDIA TensorRT 教程。本系列教程预计 4 小时,包含五个章节,旨在相对全面地介绍 TensorRT。该教程浓缩了 NVIDIA TensorRT 开发团队的技术和经验,以及与客户在合作过程中遇到的各种问题和相应的解决方法,期待开发者们在观看该教程及配套代码库后能有所收获,为学习、科研和工作添砖加瓦。

需要注意的是,在未来版本的 TensorRT 中,部分 API 和用法可能发生变化,该教程内容也会随之进行更新,请在配合代码进行学习的时候,注意开发环境和软件版本,避免兼容性方面的问题。

立即扫码充电!

TensorRT教程介绍

第一部分:TensorRT 简介(时长: 41 分钟)

TensorRT 基本特性和用法Workflow:使用 TensorRT API 搭建Workflow:使用 ONNX-ParserWorkflow:使用框架内 TensorRT 接口 本章节将介绍 TensorRT 的基本特性和用法,并介绍使用 TensorRT 的三种常见工作流程。在该章节中,将从头搭建一个可以在 TensorRT 中运行推理计算的程序,方便了解一些基本 API 的用法,然后分别使用 TensorRT 的原生 API 搭建、使用 Parser 解析 ONNX 模型,以及使用 TensorFlow 和 Pytorch 等平台自带的 TensorRT 接口这三种方法将 TensorRT 用起来。

第二部分:开发辅助工具(时长:24 分钟)

trtexecNetronpolygraphyonnx-graphsurgeonNsightSystems

本章节介绍使用 TensorRT 过程中五个常用的开发辅助工具,它们在性能测试、网络可视化、模型迁移、精度检验、计算图编辑、模型整体性能优化等方面都起到了重要的作用。第二章节将逐一介绍这五个工具,并列举在实际工作中使用这些工具的范例和经验。

第三部分:插件书写(时长:18 分钟)

使用 Plugin 的简单例子关键 API结合使用 Parser 和 PluginPlugin 高级话题使用 Plugin 的例子

本章节将着重介绍 TensorRT Plugin 的相关技术,将从一个最简单的标量加法的 Plugin 例子开始,讲解 Plugin 的原理、特性、用法等,然后介绍一个把 Plugin 和 Parser 结合使用的例子,最后补充一些 Plugin 的高级用法,以及在工作中使用 Plugin 的一些案例。

第四部分:TensorRT高级用法(时长: 28 分钟)

多 OptimizationProfile多 Stream多 ContextCUDAGraphTimingCacheRefitTacticSource硬件兼容+版本兼容更多工具

本章节将介绍 TensorRT 的一些高级话题。这些技术在 TensorRT 的使用过程中不是必须的,但在复杂的实际应用场景中,这些技术对于改善模型性能和内存占用、模型的调试分析、算法精确控制等方面有重要的作用。建议在完成前三个章节的学习后,浏览本章节,将对 TensorRT 的使用起到锦上添花的作用。

第五部分:常见优化策略(时长:1 小时 42 分钟)

概述性能分析工具性能优化实例

本章节将介绍 TensorRT 工作流程中常见的模型优化方法。该部分内容将深入讲解 TensorRT 相关性能分析工具,并以实例方式讲述曾经遇到过的一个模型在移植、优化、部署的过程中使用的优化策略。

wKgaomToPMCACEEQAABDYMZ-TIM441.gif

TensorRT Hackathon、

生成式 AI 模型优化赛

wKgaomToPMCASfeVAAAKhK271LE512.gif

由阿里云、 NVIDIA 联合举办,由阿里云天池平台组织运营的“NVIDIA TensorRT Hackathon 2023 生成式 AI 模型优化赛”正在火热报名中,截止时间 8 月 14 日上午 10:00。该赛事面向全社会开放,接受个人或不多于三人的组队形式参赛。

扫码报名参赛!

wKgaomToPMCAWwrxAAAcWoAng38399.png                    

相关资源链接:

»TensorRT 介绍https://developer.nvidia.com/tensorrt»TensorRT下载https://developer.nvidia.com/nvidia-tensorrt-download

»TensorRT Cookbook(本教程配套代码,包含视频以外的更多范例代码):https://github.com/NVIDIA/trt-samples-for-hackathon-cn/tree/master/cookbook

»TensorRT文档:https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html

»C++ API文档:https://docs.nvidia.com/deeplearning/tensorrt/api/c_api/

»Python API文档:https://docs.nvidia.com/deeplearning/tensorrt/api/python_api/ 点击“阅读原文”,查看 TensorRT 全新教程! 扫描下方海报二维码,在 8 月 8日聆听NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲,了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。


原文标题:学习资源 | NVIDIA TensorRT 全新教程上线

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3770

    浏览量

    90982

原文标题:学习资源 | NVIDIA TensorRT 全新教程上线

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【AIBOX应用】通过 NVIDIA TensorRT 实现实时快速的语义分割

    NVIDIA系列AIBOXAIBOX-OrinNano和AIBOX-OrinNX均搭载NVIDIA原装JetsonOrin核心板模组,标配工业级全金属外壳,铝合金结构导热,顶盖外壳侧面采用条幅格栅
    的头像 发表于 12-18 16:33 85次阅读
    【AIBOX应用】通过 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b> 实现实时快速的语义分割

    解锁NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一个专为优化大语言模型 (LLM) 推理而设计的库。它提供了多种先进的优化技术,包括自定义 Attention Kernel、Inflight
    的头像 发表于 12-17 17:47 115次阅读

    NVIDIA TensorRT-LLM Roadmap现已在GitHub上公开发布

    感谢众多用户及合作伙伴一直以来对NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 现已在 GitHub 上公开发布!
    的头像 发表于 11-28 10:43 255次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM Roadmap现已在GitHub上公开发布

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集扩展了 Meta Llama 开源模型集的模型阵容,包含视觉语言模型(VLM)、小语言模型(SLM)和支持视觉的更新版 Llama Guard 模型。与 NVIDIA 加速
    的头像 发表于 11-20 09:59 204次阅读

    TensorRT-LLM低精度推理优化

    本文将分享 TensorRT-LLM 中低精度量化内容,并从精度和速度角度对比 FP8 与 INT8。首先介绍性能,包括速度和精度。其次,介绍量化工具 NVIDIA TensorRT Model
    的头像 发表于 11-19 14:29 264次阅读
    <b class='flag-5'>TensorRT</b>-LLM低精度推理优化

    NVIDIA发布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德国慕尼黑举行的机器人学习大会(CoRL)上发布了全新 AI 和仿真工具以及工作流。机器人开发者可以使用这些工具和工作流,大大加快 AI 机器人(包括人形机器人)的开发工作。
    的头像 发表于 11-09 11:52 262次阅读

    NVIDIA Nemotron-4 340B模型帮助开发者生成合成训练数据

    Nemotron-4 340B 是针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列,该系列包含最先进的指导和奖励模型,以及一个用于生成式 AI 训练的数据集。
    的头像 发表于 09-06 14:59 300次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型帮助开发者生成合成训练数据

    魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社区是中国最具影响力的模型开源社区,致力给开发者提供模型即服务的体验。魔搭社区利用NVIDIA TensorRT-LLM,大大提高了大语言模型的推理性能,方便了模型应用部署,提高了大模型产业应用效率,更大规模地释放大模型的应用价值。”
    的头像 发表于 08-23 15:48 432次阅读

    NVIDIA推出全新深度学习框架fVDB

    在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。
    的头像 发表于 08-01 14:31 590次阅读

    英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务,与同样刚推出的 Llama 3.1 系列开源模型一起,为全球企业的生成式 AI
    的头像 发表于 07-25 09:48 698次阅读

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的
    的头像 发表于 04-28 10:36 547次阅读

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRTNVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热
    的头像 发表于 04-20 09:39 714次阅读

    NVIDIA宣布推出基于Omniverse Cloud API构建的全新软件框架

    NVIDIA 在 GTC 大会上宣布推出基于 Omniverse Cloud API(应用编程接口)构建的全新软件框架。
    的头像 发表于 03-25 09:09 529次阅读

    利用NVIDIA产品技术组合提升用户体验

    本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型,并借助NVIDIA Triton推理服务器在NVIDIA V1
    的头像 发表于 01-17 09:30 684次阅读

    Torch TensorRT是一个优化PyTorch模型推理性能的工具

    那么,什么是Torch TensorRT呢?Torch是我们大家聚在一起的原因,它是一个端到端的机器学习框架。而TensorRT则是NVIDIA的高性能深度
    的头像 发表于 01-09 16:41 1716次阅读
    Torch <b class='flag-5'>TensorRT</b>是一个优化PyTorch模型推理性能的工具