0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 第九届 Sky Hackathon 优秀作品展示 | 静语画韵:艺术中的无声诗篇

NVIDIA英伟达企业解决方案 来源:未知 2023-12-21 19:35 次阅读

NVIDIA 第九届Sky Hackathon 大赛旨在通过 NVIDIA Jetson 平台和 Microsoft Azure OpenAI 平台,由 NVIDIA 和 Microsoft 导师精心设计的大模型应用场景,引领参与者领略大模型的应用潜力,以及如何运用人工智能技术构建智能化解决方案。

本次 Hackathon 聚焦在如何在物联网设备上构建基于大模型的应用解决方案。参与者通过使用 NVIDIA Jetson 平台,亲身体验了大模型在图像识别和生成式模型调用方面的应用。从 Resnet50 模型的优化到 TensorRT 推理引擎的生成,每一步都呈现了 NVIDIA Jetson 在深度学习加速方面的卓越性能。

下文供稿自 NVIDIA 第九届 Sky Hackathon 大赛的冠军团队,通过本官方微信公众号推荐开发者朋友们,希望开发者朋友们能够积极交流,碰撞出更多创新的火花!

在当前时代,数字化与人工智能正不断推动艺术与技术的深度融合,开创了全新的创作与体验方式。来自山东科技大学的团队(指导老师:王鲁昆老师,团队成员:许金浩、李振宇、王俊丰、纪中华)在最近的NVIDIA 第九届 Sky Hackathon中以其杰出的作品 Narrative Canvas 夺得冠军,成为这一趋势的杰出代表。本文旨在深入分析这个项目的核心理念、技术创新之处,以及它为艺术体验带来的革命性改变,展示了这个团队如何在艺术与技术交汇的边界上探索新领域。

项目仓库:https://github.com/1438802682/NarrativeCanvas

演示视频:https://www.bilibili.com/video/BV1rc411D7pP/

项目概览:图文互动的新纪元

项目介绍

Narrative Canvas 项目的核心,在于“图生文,文生图”的相互作用。画作激发文字的创作,文字又给画作赋予了新的生命。这种互动不仅增强了艺术作品的表现力,也为观者提供了一种全新的艺术体验。在这个过程中,观者可以看到一个故事从视觉形象转化为文字叙述,再从文字中重新想象出视觉画面,这是一场视觉与文字的双重旅行。

wKgZomWEJBqAYkLXAAJKPJ5tsqE270.png

项目流程简述

  1. 图像推理:用户上传图片、选择模型和精度、执行推断,推断完成后得到处理过的图片。

  2. 生成故事:基于处理过的图片,用户选择模型、风格、主题和输入自定义提示词,完成故事生成。

  3. 生成图片:根据故事内容,用户再次选择模型、风格并输入自定义提示词,完成图像生成。

这个循环过程创造了一个从视觉到文本再回到视觉的独特旅程。

wKgZomWEJBqAOK-tAACLmC5jqrI266.png

技术创新点

使用 NVIDIA Polygraphy

对 ONNX 模型预处理优化

该项目的图片推理部分基于 mmlab 算法库中的 mmpretrain 预训练模型,精选了25 个经典主干网络进行图像分类任务。

(2014)VGG 11
(2015)Inception v3
(2015)ResNet 50
(2017)ResNeXt 50
(2018)SE-ResNet 50
(2018)ShuffleNet v1
(2018)ShuffleNet v2
(2019)Res2Net 50
(2018)MobileNet v2
(2019)MobileNet v3
(2020)RegNet
(2019)EfficientNet
(2021)EfficientNet v2
(2021)Vision Transformer
(2021)Swin Transformer
(2021)Conformer
(2021)Twins
(2021)MobileViT
(2021)CLIP
(2021)DeiT
(2022)DeiT3
(2022)MViT V2
(2022)MobileOne
(2022)EdgeNeXt
(2023)EfficientVit

上下滑动查看更多↑↓

项目团队使用了 NVIDIA 的 Polygraphy 工具对 ONNX 模型进行了优化,移除和合并了多余节点,如多余的 Transpose 节点等,这些节点原本阻碍了 TensorRT 的优化。这使得 TensorRT 引擎构建更加高效。该团队将优化前后的 ONNX 模型和原始的 pt 权重都上传到 Hugging Face。

ONNX 模型优化文件下载地址:https://huggingface.co/CtrlX/ModelReady-pretrain/tree/main

优化过程包括:

  1. 移除无用节点:删除对输出无影响的节点。

  2. 合并冗余节点:将执行相似功能的节点合并。

  3. 优化图结构:通过节点合并和折叠,简化模型结构。

  4. 提高 TensorRT 兼容性:转换或减少特殊处理的节点。

  5. 加速推理性能:优化后的模型在 TensorRT 中运行更高效。

示例:以 2023 年的最新工作 EfficientVit 为例:

优化前的 ONNX 模型:

wKgZomWEJBqAUtMPAABaFYfydwQ614.png

优化后的 ONNX 模型:

wKgZomWEJBqAertMAAA4uak33Zs062.png

通过优化的日志文件可以看出优化后的模型去除了一半以上的冗余节点,节点数量由原来的 1440 减少到了 673,经过测试后没有发现明显的精度损失,但是大大提高了引擎的构建速度:

wKgZomWEJBqAITOBAABUIEtM6tM046.png

Note:提供 Jetson Xavier NX 平台的 TensorRT 引擎序列化文件

该项目团队提供了针对 Jetson Xavier NX 8G 平台的 TensorRT 引擎序列化文件,以便用户能够一键下载并在 Jetson Xavier NX 上直接进行推理,从而快速启动项目。

Jetson Xavier NX 平台序列化引擎文件下载地址:https://huggingface.co/CtrlX/ModelReady-TRT/tree/main/Jetson-Xavier-NX-8G/engine

NVIDIA TensorRT Dynamic Shape

模式在多图推理中的应用

在构建引擎过程中,该团队在项目中利用 NVIDIA 的 TensorRT 工具启用了 Dynamic Shape 功能于批处理维度,支持一次最多处理 8 张图片,显著提升了推理效率。

wKgZomWEJBqAamrNAACF1kh5xw0549.png

NVIDIA TensorRT实现

推理精度多元选择机制:fp32/fp16/int8

该项目提供了构建不同精度引擎的代码,允许用户根据需要在精度和速度之间做出选择。

默认情况下,TensorRT 以 32 位精度 (fp32) 工作,但也支持 16 位浮点 (fp16) 和 8 位量化浮点 (int8) 执行操作。使用较低精度能减少内存需求并加快计算速度。尽管 fp16 和 fp32 的使用相对简单,使用 int8 则涉及更多复杂性。有关 int8 的更多详情,请参见 INT8 章节。

wKgZomWEJBqAEC9JAACo4AP8EnQ453.png

NVIDIA TensorRT:

启用 INT8 PTQ 量化加速推理机制

该项目通过使用 NVIDIA TensorRT 实现了 INT8 精度量化 (Post-Training Quantization, PTQ) 来加速推理。构建 INT8 引擎的步骤包括:

  1. 构建 32 位引擎,运行校准集,记录每个张量激活值分布的直方图。

  2. 根据直方图创建校准表,为每个张量提供标度值。

  3. 使用校准表和网络定义构建 INT8 引擎。

校准过程可能较慢,因此校准表的输出可以被缓存并重复使用,尤其适用于同一平台上重复构建相同网络的情况。

该项目提供了基于 ImageNet 1K val 数据集中 510 张图片的 INT8 Cache(校准表),使用 dynamic shape([batch, 3, 224, 224],batch 维度 1-8,opt=4)模式迭代 120 次。

针对 Xavier NX8G 平台,该团队测试了 10 种主流模型的 INT8 Cache 文件,由于时间限制未能覆盖全部 25 个模型,但提供了优化后的 ONNX 模型文件,可供后续测试。

ImageNet1k INT8 Cache 文件下载地址:https://huggingface.co/CtrlX/ModelReady-TRT/tree/main/Jetson-Xavier-NX-8G/int8Cache

Note:Dynamic Shape 模式与 INT8 PTQ

要在具有动态形状的网络上运行 INT8 校准,需设置校准优化配置文件,使用配置文件的 kOPT 值进行校准,且校准输入数据大小必须与配置文件匹配。

创建校准优化配置文件的示例代码如下:

wKgZomWEJBuAAo9kAACFQjs2uXs134.png

Note:双模式 INT8 量化策略

该项目为不同类型的主干网络提供了两种 INT8 量化策略:

  1. trt.IInt8MinMaxCalibrator

    这种方法选择张量的比例因子以优化量化张量的信息论内容,通常会抑制分布中的异常值。这是目前推荐的熵校准器,也是 DLA 所必需的。校准通常在层融合之前进行,校准批量大小可能会影响结果。推荐用于基于 CNN 的网络。

  2. trt.IInt8EntropyCalibrator2

    这个校准器使用激活分布的整个范围来确定比例因子,似乎更适合于 NLP 任务。校准一般在层融合之前进行。推荐用于 NVIDIA BERT(Google 官方实现的优化版本)等网络。

NVIDIA TensorRT:

Timing Cache 优化加速引擎构建

项目团队通过在 NVIDIA TensorRT 中开启 Timing Cache 优化了神经网络模型的引擎构建过程。这种方法利用了模型中重复的 layer,记录下算子的优化结果。当再次遇到相同的算子时,系统会直接使用优选结果,而非重新评估所有可行的 kernel,从而加速构建过程。

Timing Cache 文件下载地址:

https://huggingface.co/CtrlX/ModelReady-TRT/tree/main/Jetson-Xavier-NX-8G/int8Cache

下面借用了 TensorRT cookbook 中的一个示例展示 Timing Cache 的加速效果:

开启了 Timing Cache 前的日志信息

wKgZomWEJBuAdrmiAAIkzuuj-4U092.png

开启了 Timing Cache 后的日志信息:

wKgZomWEJBuAeLetAAEjxuUyOX4122.png

日志信息显示,通过 Timing Cache,多次测试被跳过,TensorRT 直接在 Cache 中找到了最快的算法。经过测试的时间显示:

  • 未启用 Timing Cache:1707.987785 ms

  • 初次启用 Timing Cache:774.889298 ms

  • 后续使用 Timing Cache:32.098293 ms

以下是该项目中与 Timing Cache 相关的 Build 代码(models/Build.py)部分,团队还提供了 Timing Cache 融合接口的多种优化方式:

wKgZomWEJBuAJEEKAAESx5Q9W7c038.png

NVIDIA NeMo Guardrails:

增强 LLM 应用的可编程护栏工具

项目在生成故事部分使用了 NeMo Guardrails,以防止大模型输出的敏感内容被用户接收。这为 LLM 服务提供了多种护栏类型,如输入护栏、对话护栏、检索护栏等。同时,项目提供了使用 Colang 编写的 NeMo Guardrails 示例。

(位于 models/configurations.py )

wKgZomWEJBuAYMAoAACHi6z0jCk736.png

NeMo Guardrails 为 LLM 服务提供五种主要护栏类型:

  1. 输入护栏(Input Rails):应用于用户输入,可能拒绝或更改输入。

  2. 对话护栏(Dialog Rails):影响 LLM 的提示方式,操作规范消息并决定是否执行某些操作。

  3. 检索护栏(Retrieval Rails):应用于 RAG 场景下检索的内容,可能拒绝或更改相关块。

  4. 执行护栏(Execution Rails):应用于需要自定义操作的输入/输出。

  5. 输出护栏(Output Rails):应用于 LLM 生成的输出,可能拒绝或更改输出。

wKgZomWEJBuAFrEUAABBRBwAEsg556.png

示例 Colang 配置:

wKgZomWEJByAUxvjAAAf52bkwZ0614.png

在项目的 models/Generater 中的 AzureChatBot 类中,护栏被用作 Azure OpenAI gpt-3.5-turbo 服务的一部分。

wKgZomWEJByALR3bAAChngLa_Wk758.png

项目架构

UI 设计原型图 wKgZomWEJByAKWvmAABdc9pdlBc340.png

项目结构图

wKgZomWEJByAbu0IAAEJ79fDhe0321.png

项目流程图

wKgZomWEJByAezfUAAD6Rt1E9SY290.png

*本文中图片来源于山东科技大学的团队,若您有任何疑问或需要使用本文中图片,请联系山东科技大学的团队

点击“阅读原文”扫描海报二维码,锁定北京时间 1 月 9 日 (星期二) 凌晨 0 点举行的线上 NVIDIA CES 2024 特别演讲。


原文标题:NVIDIA 第九届 Sky Hackathon 优秀作品展示 | 静语画韵:艺术中的无声诗篇

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3513

    浏览量

    89009

原文标题:NVIDIA 第九届 Sky Hackathon 优秀作品展示 | 静语画韵:艺术中的无声诗篇

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    研华荣获信通院工业数字孪生大赛优秀作品

    在信通院和芜湖市人民政府联合主办的2023第三届工业数字孪生大赛中,研华表现卓越,其研华数字孪生InsightAPM和研华智慧能源iEMS团队作品均获优秀作品奖,展现其在技术创新与应用实践上的卓越能力,推动“工业互联网+数字孪生”在制造业数字化转型中的重要作用。
    的头像 发表于 04-17 09:48 275次阅读
    研华荣获信通院工业数字孪生大赛<b class='flag-5'>优秀作品</b>奖

    第九届NVIDIA Sky Hackathon完美谢幕,留下AI创新的足迹

    在大数据和人工智能的浪潮中,第九届NVIDIA Sky Hackathon大赛于12月1日至12月3日在激情洋溢的氛围中圆满收官。本次大赛旨在通过
    的头像 发表于 12-06 11:58 536次阅读

    3D 艺术家在“NVIDIA Studio 创意加速”栏目中献上一场视觉上的饕餮盛宴

    艺术家 Ravissen Carpenen 做客 “NVIDIA Studio 创意加速”栏目,展示令人垂涎欲滴的逼真 3D 美食渲染作品,呈现一场视觉上的饕餮盛宴。 请点击视频查看精
    的头像 发表于 11-27 19:55 409次阅读
    3D <b class='flag-5'>艺术</b>家在“<b class='flag-5'>NVIDIA</b> Studio 创意加速”栏目中献上一场视觉上的饕餮盛宴

    NVIDIA 第九届 Sky Hackathon 邀请信 | 大模型时代下探索 AI 图文多模态解决方案

    联合发起方: NVIDIA,Microsoft Reactor 特邀赞助合作伙伴: 创乐博,合众恒跃(排名不分先后) 尊敬的老师和同学们, 我们非常荣幸邀请您参加我们第九届 Sky
    的头像 发表于 11-17 21:30 527次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>第九届</b> <b class='flag-5'>Sky</b> <b class='flag-5'>Hackathon</b> 邀请信 | 大模型时代下探索 AI 图文多模态解决方案

    华秋第九届硬创大赛全国总决赛邀你一同见证~

    2023年华秋第九届中国硬件创新创客大赛-全国总决赛即将开启! 全国总决赛活动安排 (1)活动时间 2023年11月19日(09:30-12:35) (2)活动地点 深圳福田会展中心-5楼牡丹厅
    发表于 11-17 15:33

    华秋第九届硬创大赛全国总决赛,邀你一同见证~

    2023年华秋第九届中国硬件创新创客大赛-全国总决赛即将开启! 全国总决赛活动安排 (1)活动时间 2023年11月19日(09:30-12:35) (2)活动地点 深圳福田会展中心-5楼牡丹厅
    发表于 11-17 15:30

    2023 NVIDIA 初创企业展示 · 半程展示圆满收官!

    NVIDIA 初创企业展示 通过全国范围内的项目征集、项目甄选、各分站展示、项目路演、技术交流沙龙和半程及最终展示等,挖掘优秀的科技创业项
    的头像 发表于 10-25 15:55 524次阅读
    2023 <b class='flag-5'>NVIDIA</b> 初创企业<b class='flag-5'>展示</b> · 半程<b class='flag-5'>展示</b>圆满收官!

    基于紫光同创FPGA的图像采集及AI加速|2023集创赛紫光同创杯优秀作品

    总决赛,斩获殊荣! 本篇优秀作品:2023集创赛全国总决赛紫光同创杯赛一等奖获奖作品,来自东莞理工+BugMaker的内容分享。 获奖作品:《基于紫光同创FPGA的图像采集及AI加速》获奖队伍: 东莞
    发表于 09-22 16:24

    多通道高性能视频采集与加速系统|2023集创赛紫光同创杯优秀作品

    技术支持,同“芯”共创,竭诚为赛事护航。 近期,小眼睛科技对部分获奖作品进行了专访,将陆续为大家推出优秀作品展。让我们一起走进获奖队伍的台前幕后,看看他们是如何过五关、斩六将,从全国4500+支队伍
    发表于 09-21 17:34

    晋级揭晓!华秋第九届中国硬件创新创客大赛-华东分赛区决赛成功举办!

    9月16日,在深圳市福田区科技创新局指导下,华秋第九届硬件创新创客大赛-华东分赛区决赛路演活动成功线上举办。本次大赛由深圳华秋电子有限公司(以下简称华秋)、深圳市福田区新一代信息技术产业链党委、深圳
    发表于 09-18 15:02

    2023 NVIDIA 初创企业展示杭州站圆满收官!

    通过全国范围的项目征集、项目甄选、各分站展示、项目路演 、技术交流沙龙和半程及最终展示等 ,挖掘优秀的科技创业项目和人才,并通过技术指导、资金支持、媒体宣传、产业对接等方式为创业企业提供全方位的支持。 杭州站主要聚焦大语言模型的
    的头像 发表于 09-08 17:40 375次阅读
    2023 <b class='flag-5'>NVIDIA</b> 初创企业<b class='flag-5'>展示</b>杭州站圆满收官!

    2023 NVIDIA 初创企业展示上海站圆满收官!

    的 6 场城市路演成功的拉开了序幕。 一直以来,NVIDIA 以强大的技术实力和创新精神,致力于推动全球科技创新发展,NVIDIA 初创企业展示作为 NVIDIA 主办的系列活动,持续
    的头像 发表于 08-25 20:45 684次阅读
    2023 <b class='flag-5'>NVIDIA</b> 初创企业<b class='flag-5'>展示</b>上海站圆满收官!

    晋级榜单揭晓!华秋第九届硬创大赛-华南分赛区路演成功举办

    7月21日,第十五深创赛福田预选赛区暨华秋第九届硬创大赛华南分赛区决赛路演活动在深圳华强科创广场成功举办。活动由深圳华秋电子有限公司(以下简称 华秋 )、深圳市福田区新一代信息技术产业链党委、深圳
    发表于 07-31 15:17

    晋级榜单揭晓!华秋第九届硬创大赛-华南分赛区路演成功举办

    7月21日,第十五届深创赛福田预选赛区暨华秋第九届硬创大赛华南分赛区决赛路演活动在深圳华强科创广场成功举办。活动由深圳华秋电子有限公司(以下简称华秋)、深圳市福田区新一代信息技术产业链党委、深圳
    的头像 发表于 07-31 14:58 555次阅读
    晋级榜单揭晓!华秋<b class='flag-5'>第九届</b>硬创大赛-华南分赛区路演成功举办

    即刻报名第三届 NVIDIA TensorRT Hackathon 生成式 AI 模型优化赛

    近日,由阿里云及 NVIDIA 联合举办的 “NVIDIA TensorRT Hackathon 2023 生成式 AI 模型优化赛”已正式启动。此大赛是由阿里云天池组织运营,TensorRT
    的头像 发表于 07-17 19:45 380次阅读
    即刻报名第三届 <b class='flag-5'>NVIDIA</b> TensorRT <b class='flag-5'>Hackathon</b> 生成式 AI 模型优化赛