0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

学习资源 | NVIDIA TensorRT 全新教程上线

NVIDIA英伟达 来源:未知 2023-08-04 17:45 次阅读

NVIDIA TensorRT是一个用于高效实现已训练好的深度学习模型推理过程的软件开发工具包,内含推理优化器和运行环境两部分,其目的在于让深度学习模型能够在 GPU 上以更高吞吐量和更低的延迟运行,目前已在业界得到广泛应用与部署。

为了帮助广大开发者更好地了解 TensorRT,NVIDIA GPU 计算专家团队(Devtech)工程师李玮、王猛基于最新的 8.6.1 版本录制了NVIDIA TensorRT 教程。本系列教程预计 4 小时,包含五个章节,旨在相对全面地介绍 TensorRT。该教程浓缩了 NVIDIA TensorRT 开发团队的技术和经验,以及与客户在合作过程中遇到的各种问题和相应的解决方法,期待开发者们在观看该教程及配套代码库后能有所收获,为学习、科研和工作添砖加瓦。

需要注意的是,在未来版本的 TensorRT 中,部分 API 和用法可能发生变化,该教程内容也会随之进行更新,请在配合代码进行学习的时候,注意开发环境和软件版本,避免兼容性方面的问题。

立即扫码充电!

TensorRT教程介绍

第一部分:TensorRT 简介(时长: 41 分钟)

TensorRT 基本特性和用法Workflow:使用 TensorRT API 搭建Workflow:使用 ONNX-ParserWorkflow:使用框架内 TensorRT 接口 本章节将介绍 TensorRT 的基本特性和用法,并介绍使用 TensorRT 的三种常见工作流程。在该章节中,将从头搭建一个可以在 TensorRT 中运行推理计算的程序,方便了解一些基本 API 的用法,然后分别使用 TensorRT 的原生 API 搭建、使用 Parser 解析 ONNX 模型,以及使用 TensorFlow 和 Pytorch 等平台自带的 TensorRT 接口这三种方法将 TensorRT 用起来。

第二部分:开发辅助工具(时长:24 分钟)

trtexecNetronpolygraphyonnx-graphsurgeonNsightSystems

本章节介绍使用 TensorRT 过程中五个常用的开发辅助工具,它们在性能测试、网络可视化、模型迁移、精度检验、计算图编辑、模型整体性能优化等方面都起到了重要的作用。第二章节将逐一介绍这五个工具,并列举在实际工作中使用这些工具的范例和经验。

第三部分:插件书写(时长:18 分钟)

使用 Plugin 的简单例子关键 API结合使用 Parser 和 PluginPlugin 高级话题使用 Plugin 的例子

本章节将着重介绍 TensorRT Plugin 的相关技术,将从一个最简单的标量加法的 Plugin 例子开始,讲解 Plugin 的原理、特性、用法等,然后介绍一个把 Plugin 和 Parser 结合使用的例子,最后补充一些 Plugin 的高级用法,以及在工作中使用 Plugin 的一些案例。

第四部分:TensorRT高级用法(时长: 28 分钟)

多 OptimizationProfile多 Stream多 ContextCUDAGraphTimingCacheRefitTacticSource硬件兼容+版本兼容更多工具

本章节将介绍 TensorRT 的一些高级话题。这些技术在 TensorRT 的使用过程中不是必须的,但在复杂的实际应用场景中,这些技术对于改善模型性能和内存占用、模型的调试分析、算法精确控制等方面有重要的作用。建议在完成前三个章节的学习后,浏览本章节,将对 TensorRT 的使用起到锦上添花的作用。

第五部分:常见优化策略(时长:1 小时 42 分钟)

概述性能分析工具性能优化实例

本章节将介绍 TensorRT 工作流程中常见的模型优化方法。该部分内容将深入讲解 TensorRT 相关性能分析工具,并以实例方式讲述曾经遇到过的一个模型在移植、优化、部署的过程中使用的优化策略。

wKgaomToPMCACEEQAABDYMZ-TIM441.gif

TensorRT Hackathon、

生成式 AI 模型优化赛

wKgaomToPMCASfeVAAAKhK271LE512.gif

由阿里云、 NVIDIA 联合举办,由阿里云天池平台组织运营的“NVIDIA TensorRT Hackathon 2023 生成式 AI 模型优化赛”正在火热报名中,截止时间 8 月 14 日上午 10:00。该赛事面向全社会开放,接受个人或不多于三人的组队形式参赛。

扫码报名参赛!

wKgaomToPMCAWwrxAAAcWoAng38399.png                    

相关资源链接:

»TensorRT 介绍https://developer.nvidia.com/tensorrt»TensorRT下载https://developer.nvidia.com/nvidia-tensorrt-download

»TensorRT Cookbook(本教程配套代码,包含视频以外的更多范例代码):https://github.com/NVIDIA/trt-samples-for-hackathon-cn/tree/master/cookbook

»TensorRT文档:https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html

»C++ API文档:https://docs.nvidia.com/deeplearning/tensorrt/api/c_api/

»Python API文档:https://docs.nvidia.com/deeplearning/tensorrt/api/python_api/ 点击“阅读原文”,查看 TensorRT 全新教程! 扫描下方海报二维码,在 8 月 8日聆听NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲,了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。


原文标题:学习资源 | NVIDIA TensorRT 全新教程上线

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3719

    浏览量

    90652

原文标题:学习资源 | NVIDIA TensorRT 全新教程上线

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    使用全新NVIDIA AI Blueprint开发视觉AI智能体

    为提高生产力、优化流程和创造更加安全的空间,埃森哲、戴尔科技和联想等公司正在使用全新 NVIDIA AI Blueprint 开发视觉 AI 智能体。
    的头像 发表于 11-06 13:58 125次阅读

    NVIDIA Nemotron-4 340B模型帮助开发者生成合成训练数据

    Nemotron-4 340B 是针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列,该系列包含最先进的指导和奖励模型,以及一个用于生成式 AI 训练的数据集。
    的头像 发表于 09-06 14:59 247次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型帮助开发者生成合成训练数据

    魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社区是中国最具影响力的模型开源社区,致力给开发者提供模型即服务的体验。魔搭社区利用NVIDIA TensorRT-LLM,大大提高了大语言模型的推理性能,方便了模型应用部署,提高了大模型产业应用效率,更大规模地释放大模型的应用价值。”
    的头像 发表于 08-23 15:48 350次阅读

    NVIDIA推出全新深度学习框架fVDB

    在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。
    的头像 发表于 08-01 14:31 492次阅读

    英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务,与同样刚推出的 Llama 3.1 系列开源模型一起,为全球企业的生成式 AI
    的头像 发表于 07-25 09:48 636次阅读

    NVIDIA推出用于支持在全新GeForce RTX AI笔记本电脑上运行的AI助手及数字人

    NVIDIA 宣布推出全新 NVIDIA RTX 技术,用于支持在全新 GeForce RTX AI 笔记本电脑上运行的 AI 助手及数字人。  
    的头像 发表于 06-04 10:19 651次阅读

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的
    的头像 发表于 04-28 10:36 459次阅读

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRTNVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热
    的头像 发表于 04-20 09:39 607次阅读

    NVIDIA宣布推出基于Omniverse Cloud API构建的全新软件框架

    NVIDIA 在 GTC 大会上宣布推出基于 Omniverse Cloud API(应用编程接口)构建的全新软件框架。
    的头像 发表于 03-25 09:09 475次阅读

    利用NVIDIA产品技术组合提升用户体验

    本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型,并借助NVIDIA Triton推理服务器在NVIDIA V1
    的头像 发表于 01-17 09:30 626次阅读

    Torch TensorRT是一个优化PyTorch模型推理性能的工具

    那么,什么是Torch TensorRT呢?Torch是我们大家聚在一起的原因,它是一个端到端的机器学习框架。而TensorRT则是NVIDIA的高性能深度
    的头像 发表于 01-09 16:41 1435次阅读
    Torch <b class='flag-5'>TensorRT</b>是一个优化PyTorch模型推理性能的工具

    如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型

    的特点和优势。然而,这些工具往往未能充分发挥 GPU 的性能。 为了解决这些问题,NVIDIA 推出了一种全新的解决方案—— Tens
    的头像 发表于 12-04 20:25 877次阅读
    如何在 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT</b>-LLM 中支持 Qwen 模型

    NVIDIA 知乎精彩问答甄选 | 查看关于 NVIDIA Omniverse 的相关精彩问答

    甄选问答将为您分享  NVIDIA Omniverse 的相关精彩问答 Q: NVIDIA 全新的 Omniverse Cloud API 有何亮点? A: NVIDIA 将为开发者和
    的头像 发表于 12-01 18:40 427次阅读
    <b class='flag-5'>NVIDIA</b> 知乎精彩问答甄选 | 查看关于 <b class='flag-5'>NVIDIA</b> Omniverse 的相关精彩问答

    TensorRT-LLM初探(一)运行llama

    TensorRT-LLM正式出来有半个月了,一直没有时间玩,周末趁着有时间跑一下。
    的头像 发表于 11-16 17:39 1165次阅读
    <b class='flag-5'>TensorRT</b>-LLM初探(一)运行llama

    华为云全新上线 Serverless 应用中心,支持一键构建文生图应用

    近日,华为云全新上线 Serverless 应用中心,提供大量应用模板,帮助用户实现一键部署函数和周边依赖资源,节省部署时间,快速上手将应用部署到华为云函数工作流 FunctionGraph,并一键
    的头像 发表于 11-13 09:36 566次阅读
    华为云<b class='flag-5'>全新</b><b class='flag-5'>上线</b> Serverless 应用中心,支持一键构建文生图应用