解决计算机视觉深度学习应用的性能瓶颈问题-电子发烧友网

在CVPR 2018大会上，英伟达开源了数据增强和数据解码的两个新的库：

NVIDIA DALI：一个GPU加速的数据增强和图像加载库，用于优化深度学习框架的数据pipeline

NVIDIA nvJPEG：一个高性能的GPU加速的图像解码库

由深度学习驱动的计算机视觉应用程序包括复杂的、多阶段的预处理数据pipeline，包括计算密集型的步骤，例如从磁盘加载和提取数据、解码、裁剪和调整大小、颜色和空间变换以及格式转换。

通过使用GPU加速数据增强，NVIDIA DALI解决了当今计算机视觉深度学习应用程序中的性能瓶颈问题，这些应用程序包括复杂的多阶段数据增强步骤。借助DALI，深度学习研究人员可以通过MXNet、TensorFlow和PyTorch在AWS P3 8 GPU实例或Volta GPU的DGX-1系统上提高图像分类模型（比如ResNet-50）的训练性能。由于可以跨框架实现高性能的数据加载和增强，框架用户将能够减少代码重复。

DALI依赖于新的NVIDIA nvJPEG库进行高性能的GPU加速解码。

DALI的优势包括：

能与MxNet，TensorFlow和PyTorch的框架直接集成

具有支持多种数据格式（如JPEG，原始格式，LMDB，RecordIO和TFRecord）的便携式训练工作流

具有可配置图形和自定义操作符的自定义数据pipeline

使用nvJPEG进行高性能的单图像解码和批量JPEG解码

nvJPEG是一个用于JPEG解码的高性能GPU加速库。nvJPEG支持同时使用CPU和GPU对单个图像和批量图像进行解码、颜色空间转换、多相位解码，以及混合解码。与只使用CPU解码相比，使用nvJPEG进行解码的应用程序具有更高的吞吐量和更低的延迟。

nvJPEG为计算机视觉应用中常用的JPEG格式提供低延迟解码器，如图像分类、物体检测和图像分割等应用。对于深度学习训练应用，nvJPEG可以加速数据加载和预处理，如平移、缩小，放大，翻转等。对于需要低延迟深度学习推理的应用，nvJPEG可用于实时地进行JPEG解码和调整大小。

nvJPEG的优势包括：

使用CPU和GPU进行混合解码

可以进行单个图像解码和批量图像解码

色彩空间可以转换为RGB，BGR，RGBI，BGRI和YUV

单相位解码和多相位解码

DALI已经开源，可以从GitHub获取：

https://github.com/NVIDIA/dali

nvJPEG预发行版也已经可以免费下载，用于收集反馈和测试，今年晚些时候会作为CUDA工具包的一部分提供。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

计算机视觉

计算机视觉

+关注

关注
8

文章
1698

浏览量
46028
英伟达

英伟达

+关注

关注
22

文章
3786

浏览量
91276

原文标题：英伟达开源数据增强和数据解码库，解决计算机视觉性能瓶颈

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

请问计算机视觉与深度学习要看什么书？

计算机视觉与深度学习，看这本书就够了

发表于 05-21 12:43

深度学习在计算机视觉领域图像应用总结精选资料下载

简单的回顾的话，2006年Geoffrey Hinton的论文点燃了“这把火”，现在已经有不少人开始泼“冷水”了，主要是AI泡沫太大，而且深度学习不是包治百病的药方。计算机视觉不是

发表于 07-28 08:22

超全！深度学习在计算机视觉领域应用一览（附链接）精选资料分享

这是一份深度学习在计算机视觉领域的超全应用预览~简单回顾的话，2006年Geof...

发表于 07-28 07:35

深度学习与传统计算机视觉简介

文章目录1 简介1.1 深度学习与传统计算机视觉1.2 性能考量1.3 社区支持2 结论3 参考在计算机

发表于 12-23 06:17

深度学习是否会取代传统的计算机视觉？

理解传统的计算机视觉实际上真的有助于你更好的使用深度学习。例如，计算机视觉中最常见的神经网络是卷

发表于 04-02 10:37 •6227次阅读

深度学习不能取代计算机视觉技术背后的真正原因

深度学习只是一种 计算机视觉工具，而不是包治百病的良药，不要因为流行就一味地使用它。传统的计算机视觉

发表于 04-05 11:37 •4790次阅读

技术 | 深度学习在计算机视觉领域的瓶颈已至

霍金的弟子，约翰霍普金斯大学教授Alan Yuille提出“深度学习在计算机视觉领域的瓶颈已至。

发表于 07-05 10:07 •2577次阅读

深度学习在计算机视觉上的四大应用

计算机视觉中比较成功的深度学习的应用，包括人脸识别，图像问答，物体检测，物体跟踪。

发表于 08-24 16:16 •4857次阅读

计算机视觉应用中3大瓶颈问题及解决方案

/jig.190446 计算机视觉在智能制造工业检测中发挥着检测识别和定位分析的重要作用，为提高工业检测的检测速率和准确率以及智能自动化程度做出了巨大的贡献。然而计算机视觉在应用过程中

发表于 10-23 10:59 •1w次阅读

通过迁移学习解决计算机视觉问题

来源：公众号AI公园作者：OrhanG. Yalın 编译：ronghuaiyang 导读使用SOTA的预训练模型来通过迁移学习解决现实的计算机视觉问题。如果你试过构建高精度的机器学习

发表于 10-31 10:54 •2461次阅读

深度学习和传统计算机视觉技术在新兴领域的比较

是不是深度学习就可以解决所有问题呢？是不是它就比传统计算机视觉方法好呢？但是深度学习无法解决所有

发表于 11-28 11:01 •1648次阅读

浅谈深度学习在计算机视觉领域的三大瓶颈

深度学习能够实现的前提是大量经过标注的数据，这使得计算机视觉领域的研究人员倾向于在数据资源丰富的领域搞研究，而不是去重要的领域搞研究。

发表于 06-11 10:22 •448次阅读

计算机视觉中的九种深度学习技术

计算机视觉中仍有许多具有挑战性的问题需要解决。然而，深度学习方法正在针对某些特定问题取得最新成果。在最基本的问题上，最有趣的不仅仅是深度

发表于 08-21 09:56 •625次阅读

反思深度学习与传统计算机视觉的关系

某种程度上，深度学习最大的优势就是自动创建没有人会想到的特性能力。如今，深度学习在众多领域都有一席之地，尤其是在

发表于 09-12 08:29 •575次阅读

深度学习在计算机视觉领域的应用

随着人工智能技术的飞速发展，深度学习作为其中的核心技术之一，已经在计算机视觉领域取得了显著的成果。计算机

发表于 07-01 11:38 •839次阅读