0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TensorRT极致推理加速,望尘科技打造新一代实时AI体育全场景多维重构引擎

NVIDIA英伟达企业解决方案 来源:未知 2022-12-01 22:35 次阅读

深圳望尘科技公司拥有国内领先的 AI 视觉算法团队和实时渲染引擎,十年来一直专注于体育游戏与其相关 AI 视觉技术的研发,积累了巨量的球员角色数据库,不仅有所有在国际足联注册的 2 万名职业球员精确到厘米的球员体型、骨长、BMI、体脂肌肉比等数据,还有数千名顶级球员高精度的 3D 模型,几乎全球所有主要球场的高精度模型。




基于这些高质量结构化的数据,Arena4D 可将捕捉结果在实时渲染引擎中以接近照片级真实的质量渲染,用完全自由的镜头特效和运镜方式实现前所未有的震撼体验。


Arena4D 空间追踪识别及数据处理

面临算力挑战


  • 球员和球的运动速度快,姿态变化大,且衣服外貌相似性较大,难以使用行业通用的 MOT 算法进行高质量的追踪和姿态识别。

  • 即使是 4k 图像,球员和球在图像中太小,追踪困难。

  • 多台高清摄像头每帧图像需上传到显卡进行实时转码、降噪等前处理工作,数据吞吐量较大。

  • 基于神经网络的计算流水线,需要实时进行多个视角、多个运动员的追踪、识别、姿态估计与降噪计算。

  • 在多个 AI 模型级联计算流水线中,每个 AI 模型之间的数据处理与拷贝占用了大量的时间。


NVIDIA AI 计算平台为Arena4D

实现全流程GPU加速提供算力支持


基于以上挑战,望尘科技选择了采用 NVIDIA AI 计算平台来提供支持,使用后给研发和项目落地带来了巨大的支持和提升。


1、基于 GalaSports 体育游戏渲染生成巨量的合成数据,在 NVIDIA 数据中心 GPU 上进行加速训练。首先在有 GT 的合成数据上训练基础网络,然后再在手工标注的真实数据上进行 finetune。


2、Arena4D 采用了 NVIDIA TensorRT 推理加速引擎,TensorRT 首先对神经网络进行量化处理,然后再优化、合并算子,最后经过 Batch 化,推理处理速度较原来提升了 4-12 倍,能高效地处理多路摄像头 4k 高清数据,实时提取球员的 3D Pose 和外貌特征并进行匹配计算。


3、将原有基于 CPU 运行的数据拷贝,图像格式转换,图像 crop/resize 等耗时较多的操作流水线,利用 CUDA 进行实现,完全切换到 GPU 处理,比起 CPU 实现的方案,加速 50~100 倍。


4、针对体育场景中运动员速度快、运动幅度大、图像中尺寸小的特点,改进了网络结构和算子,使其适合体育场这种稀疏变化,追踪角色小的场景;提升了 MOT 算法,通过多个视图的 fusion 网络对 2D 追踪结果进行 finetune,实现多视图在 3D 空间的追踪。


图1:整体流程

图片来源及所属:Galasports 望尘科技


5、针对神经网络流水线的计算延迟问题,首先根据体育比赛的使用场景与相机视角对模型结构进行了优化,根据不同体育类型的相机机位和球场尺度,设计了专门针对特定比赛的识别网络,大大降低了网络的复杂度;基于连续帧的姿态计算骨长度和 BMI 等球员特征,在数据库中进行匹配提升识别准确率;针对多相机从内存到显存大量数据拷贝 IObound 问题,使用 CUDA 多流技术实现了内存拷贝与数据处理并行化,降低了 overhead,4 路4k 相机数据的拷贝与转码从 50ms 减少到 30ms;然后使用量化工具对网络进行 fp16/int8(QAT) 量化加速,最后使用 NVIDIA TensorRT 针对 NVIDIA 数据中心 GPU 编译,在 NVIDIA 数据中心 GPU 上能达到最优性能的模型。


图2:计算延迟解决思路

图片来源及所属:Galasports 望尘科技


6、整个流水线经过 TensorRT 编译运行在 NVIDIA 数据中心 GPU 上,每路视频信号由一张 GPU 进行实时计算,最后在 CPU 中对多路计算结果降噪融合。最终,以足球场场景为例,追踪目标为 1 个足球 + 22 名球员 + 3 名教练的位置与骨骼,在一张 NVIDIA 数据中心 GPU 设备上我们实现了平均 50ms/帧的速度,在二张 NVIDIA 数据中心 GPU 设备上能达到平均 30ms/帧的速度,整个流水线比原型提升了 18 倍。


使用了 NVIDIA TensorRT 推理加速引擎NVIDIA 数据中心计算卡,Arena4D 整个流水线可实时运行,进一步提升了用户使用体验,为扩展 AI 体育方向的其他业务、甚至是 XR 场景的加入打下了良好的基础。


NVIDIA 助力望尘科技

打造新一代实时 AI 体育全场景多维重构引擎


Arena4D 通过 NVIDIA TensorRT 等技术,实现了多视图在 3D 空间的追踪、提升了识别骨长度和 BMI 等球员特征的准确率、完成了内存拷贝与数据处理的并行化、改进了网络结构和算子使其适合体育场的稀疏变化,最终实现全流程 GPU 加速,速度提升超过 50~100 倍。


AI 体育行业是最受关注的人工智能应用领域之一,传统的体育企业也开始拥抱科技,纷纷引入人工智能产业。一个集技术、人才与场景优势的科技企业必须与一个优秀的合作伙伴一起积极开拓和长期发展。NVIDIA 提供的 GPU 解决方案,解决了深度学习机器学习的技术难题,使得望尘科技在 AI 体育领域能够持续不断地创新产品,拓宽 AI 应用场景,为观众和球迷提供新时代的数字化全新观赛体验。


NVIDIA 初创加速计划


望尘科技是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制、旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。


想获得 NVIDIA 初创加速生态助力?扫描下方二维码,仅需一分钟填写意向申请表单,获得快速联系。



原文标题:TensorRT极致推理加速,望尘科技打造新一代实时AI体育全场景多维重构引擎

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3750

    浏览量

    90902

原文标题:TensorRT极致推理加速,望尘科技打造新一代实时AI体育全场景多维重构引擎

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA助力丽蟾科技打造AI训练与推理加速解决方案

    丽蟾科技通过 Leaper 资源管理平台集成 NVIDIA AI Enterprise,为企业和科研机构提供了套高效、灵活的 AI 训练与推理加速
    的头像 发表于 10-27 10:03 185次阅读
    NVIDIA助力丽蟾科技<b class='flag-5'>打造</b><b class='flag-5'>AI</b>训练与<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解决方案

    李开复:中国擅长打造经济实惠的AI推理引擎

    10月22日上午,零一万物公司的创始人兼首席执行官李开复在与外媒的交流中透露,其公司旗下的Yi-Lightning(闪电模型)在推理成本上已实现了显著优势,比OpenAI的GPT-4o模型低了31倍。他强调,中国擅长打造经济实惠的AI
    的头像 发表于 10-22 16:54 331次阅读

    一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI中更快的嵌入处理

    电子发烧友网站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级
    发表于 08-15 11:06 0次下载
    下<b class='flag-5'>一代</b>高功能<b class='flag-5'>新一代</b><b class='flag-5'>AI</b><b class='flag-5'>加速</b>器(DRP-<b class='flag-5'>AI</b>3):10x在高级<b class='flag-5'>AI</b>系统高级<b class='flag-5'>AI</b>中更快的嵌入处理

    惠普AI PC全场景AI解决方案重磅发布, AI步到位,智能触手可及

    北京,2024年7月30日 —— 7月30日, “AI 用起来——惠普AI PC全场景AI生态大会”在北京成功举办。此次大会上,惠普正式推出了创新的
    的头像 发表于 08-02 17:53 648次阅读
    惠普<b class='flag-5'>AI</b> PC<b class='flag-5'>全场景</b><b class='flag-5'>AI</b>解决方案重磅发布, <b class='flag-5'>AI</b><b class='flag-5'>一</b>步到位,智能触手可及

    专注充电充满想象,罗马仕全球品牌升级打造全场景用电体验生态

    在充电行业深耕,通过海量技术和用户积累,持续扩展充电产品生态的成果。其洞察市场需求,围绕技术创新、全球化品牌战略布局等多个方面进行升级,打造罗马仕全场景用电方案,给予用户更愉悦、更极致的充电体验。 本次发布会也展示了罗马仕过去十
    的头像 发表于 07-21 10:15 571次阅读
    专注充电充满想象,罗马仕全球品牌升级<b class='flag-5'>打造</b><b class='flag-5'>全场景</b>用电体验生态

    专注充电充满想象,罗马仕全球品牌升级打造全场景用电体验生态

    在充电行业深耕,通过海量技术和用户积累,持续扩展充电产品生态的成果。其洞察市场需求,围绕技术创新、全球化品牌战略布局等多个方面进行升级,打造罗马仕全场景用电方案,给予用户更愉悦、更极致的充电体验。   本次发布会也展
    发表于 07-19 20:46 369次阅读
    专注充电充满想象,罗马仕全球品牌升级<b class='flag-5'>打造</b><b class='flag-5'>全场景</b>用电体验生态

    Nullmax正式推出新一代自动驾驶技术Nullmax Intelligence

    7月16日,Nullmax在上海举办“AI无止境,智变新开端”2024技术发布会,正式推出新一代自动驾驶技术Nullmax Intelligence(简称“NI”)。新技术着重于打造全场景
    的头像 发表于 07-17 09:32 599次阅读
    Nullmax正式推出<b class='flag-5'>新一代</b>自动驾驶技术Nullmax Intelligence

    蚂蚁数科发布新一代融合AI风控引擎“AIR Engine”

    在数字化浪潮的推动下,金融科技领域的风控技术正迎来新的突破。近日,蚂蚁数科旗下的蚁盾风控团队正式发布了新一代融合AI风控引擎——“AIR Engine(AIFUSERiskEngine)”,该
    的头像 发表于 06-26 18:20 1214次阅读

    步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    性能,加速模型的训练和推理过程。 2. 生成式 AI 解决方案 与英伟达 Grace CPU、新一代网络芯片等产品起,面向生成式
    发表于 05-13 17:16

    MediaTek携手望尘科技通过移动端光线追踪技术打造沉浸体育游戏体验

    MediaTek携手望尘科技(GALA Sports),在手游领域实现了光线追踪技术的革命性应用。该技术现已成功融入望尘科技旗下的钓鱼与篮球体育游戏中,极大地提升了玩家的视觉沉浸体验,让游戏画面更加逼真。
    的头像 发表于 05-07 11:39 673次阅读

    地平线发布新一代Horizon SuperDrive™全场景智能驾驶解决方案

    4月24日,地平线举办“征程所向,向高而行”——2024智驾科技产品发布会。立足于智能驾驶时代,地平线凭借对软硬结合全栈技术理念的前瞻预判和深厚积累,重磅发布新一代车载智能计算方案征程®6系列以及
    的头像 发表于 04-25 09:17 1466次阅读
    地平线发布<b class='flag-5'>新一代</b>Horizon SuperDrive™<b class='flag-5'>全场景</b>智能驾驶解决方案

    Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

    Arm发布的新一代Ethos-U AI加速器确实在业界引起了广泛关注。
    的头像 发表于 04-18 15:59 727次阅读

    华为FDD GigaGreen Radios全面升级,构筑5G-A全业务多维体验网络

    面向5G-A全业务多维体验升级需求。华为推出最新一代FDD GigaGreen Massive MIMO和8T8R,通过Gigaband Beamforming打造极致体验,通过0 B
    的头像 发表于 02-28 15:55 667次阅读

    Torch TensorRT个优化PyTorch模型推理性能的工具

    那么,什么是Torch TensorRT呢?Torch是我们大家聚在起的原因,它是个端到端的机器学习框架。而TensorRT则是NVIDIA的高性能深度学习
    的头像 发表于 01-09 16:41 1627次阅读
    Torch <b class='flag-5'>TensorRT</b>是<b class='flag-5'>一</b>个优化PyTorch模型<b class='flag-5'>推理</b>性能的工具

    HarmonyOS:使用MindSpore Lite引擎进行模型推理

    场景介绍 MindSpore Lite 是AI 引擎,它提供了面向不同硬件设备 AI 模型推理
    发表于 12-14 11:41