关于深度学习中的图像处理应用

作者丨疾星@知乎来

导读

图像处理领域是深度学习和机器视觉领域重要的研究分支，本文第一部分将介绍深度学习中图像处理的常用技巧，第二部分则会浅析深度学习中图像处理的主流应用。

近年以来，随着深度学习在图像识别领域取得巨大突破(以AI之父Geoffry Hinton在2012年提出的高精度AlexNet图像识别网络为代表)，掀起了以神经网络为基础的深度学习研究热潮。目前为止，图像处理已成为深度学习中重要的研究领域，几乎所有的深度学习框架都支持图像处理工具。当前深度学习在图像处理领域的应用可分为三方面:图像处理(基本图像变换)、图像识别(以神经网络为主流的图像特征提取)和图像生成(以神经风格迁移为代表)。本文第一部分介绍深度学习中图像处理的常用技巧，第二部分浅析深度学习中图像处理的主流应用，最后对本文内容进行简要总结。

一．深度学习中图像处理的常见技巧

目前几乎所有的深度学习框架均支持图像处理工具包，包括Google开发的Tensorflow、Microsoft的CNTK等。以操作简单的Keras前端，Tensorflow后端开发框架为例介绍图像处理中的常见操作技巧:

1. 数据增强

制约深度学习发展的三要素分别为算法、算力和数据，其中算法性能由设计方式决定，算力供给的关键在于硬件处理器效能，算法和算力相同时，数据量的多少直接决定模型性能的最终优劣。进行图像识别时，经常出现因原始图像数目不足而导致的输出曲线过拟合，从而无法训练出能泛化到新图像集上的模型。数据增强根据当前已知的图像数据集生成更多的训练图像，具体实现是利用多种能够生成可信图像的随机变换来增加原始图像数量。数据增强前后的对比结果如图1所示: 图1a 原始图像

图1b 数据增强后的图像其中关键代码如下(定义增强数据的操作，包括缩放，平移和旋转等):

对比可知，数据增强的实质是在未改变原始图像特征内容的基础上(例如上图中的关键对象:猫、铁笼、食物)对图像数量的扩充，从而避免因图像不足而导致的模型过拟合与泛化性差等缺陷，在小型图像数据集上进行训练时尤其有效。

2. 图像去噪

现实的图像在传播过程中，由于传输波动和受外界噪声干扰而很容易引起图像质量下降。图像去噪是指滤除图像包含的干扰信息而保留有用信息，常见去噪方法包括非局部平均过滤算法、高斯滤波算法和自适应滤除噪声的卷积神经网络等。简要介绍如下: 2.1 非局部平均过滤算法 非局部平均过滤算法的降噪原理如下:图片中像素的设定通过与其周围的像素点加权而成，也就是图片中某点的像素设定和其周围像素的权重设定有关。具体原理如下式所示: 式中代表位置像素点受位置像素点影响的权重大小，代表选取像素点周围半径为范围内的像素点作为加权参照。和分别代表像素点周围像素权值的大小统计和像素点受周围半径内像素影响的加权总和。对原始图像添加噪声，随机设定3000个像素点为白色(RGB值均为255)，可以看出添加噪声后的图像相对原始图像增添了许多噪声白斑，如图2所示:

图2a 原始海滩背景图像

图2b 添加噪声后的背景图像然后使用openCV内置的非局部平均噪声过滤算法滤除图片噪声，结果如图3所示:

图3 非局部平均噪声滤波后得到的背景图像观察非局部平均噪声算法滤波前后的图像，可知滤波后图像的白斑噪声点明显减少，图像的质量得到有效提升，有利于后续的编码处理和传输。 2.2 去噪神经网络 去噪神经网络通常是以CNN(卷积神经网络为基础)，其实质是：利用在无噪图像集上训练完成的去噪模型，滤除预测图像中包含的噪声信息。使用图像识别中最常见的mnist手写图像库为训练集，mnist包含6万张训练集图像和1万张测试集图像，其大小均为28*28，按照图像内容的不同分为手写数字0-9，mnist数据库内置于keras中。搭建去噪神经网络结构，如图4所示:

图4 简单的去噪神经网络结构使用去噪神经网络对mnist图像库中添加噪声的图像去噪，去噪前后对比结果如图5、图6所示，其中下标相同的Noise与Fliter相对应:

图5 对原始图像添加噪声

图6 使用去噪神经网络滤除噪声观察去噪前后图片可知，去噪神经网络通过特征提取和监督学习等方式，对Mnist手写图像集实现了非必要噪声信息滤除，是简单常用的图像去噪器。 2.3 图像超分辨率重建(SR,Super Resolution) SR是图像处理中的经典应用，是图像增强领域的重要技术。其基本思想是通过提取低分辨率的原始图像特征来重构高分辨率的图像。按照其参考低分辨率图像种类和数目的不同，主要分为以下两种:

Image SR：特点是重构图像时，可供参考的原始低分辨率图像少，通常不依赖于其他图像而只参考当前的低分辨率图像，也称为单图超分辨率(SISR，single image super resolution)。

Video SR：特点是重构图像需要参照多个不同的原始低分辨率图像，也称为多帧超分辨率(MFSR，multi-frame super resolution)。通常MFSR相对SISR具有更高的重构质量和更多的特征匹配，代价是计算资源的更多消耗。

SR重构质量可通过图像质量评估的参考标准PSNR和SSIM进行评价,PSNR值和SSIM值越高，代表重建图像像素值与标准值越接近。其中PSNR定义如下（MSE代表图像评估中的均方误差）: 其中MSE的定义如下:

SSIM定义简化如下(其中代表均值，代表均方差): 近年以来，图像超分辨率重建技术逐渐成为深度学习领域的研究热点，先后涌现出SRCNN（Super-Resolution Convontional Netural Network,超分辨率卷积神经网络）和FSRCNN（Fast Super-Resolution Convontional Netural Network，快速超分辨卷积神经网络）等超分辨率重构结构，分别介绍如下:

SRCNN：SRCNN是香港中文大学在2014年提出的一种Image SR重构网络，核心结构是利用CNN网络对原始的低分辨率图像进行特征提取和映射，最后完成高分辨率图像重构，其实质是利用深度学习神经网络实现稀疏自编码器。SRCNN网络核心结构如图7所示:

图7 SRCNN网络的结构示意图如图7所示，SRCNN网络完成图像超分辨率转换的过程分为三部分：首先通过插值法对原始低分辨率图像进行维度扩展，目标是保证输入网络的图像与目标图像尺寸相同；然后将拓展后的原始图像通过卷积网络拟合的非线性映射进行特征提取，完成低分辨率特征图到高分辨率特征图的映射。CNN特征提取网络是SRCNN网络的关键结构，文中采用的特征提取网络为3层堆叠的CNN；最后根据获得的高分辨率图像特征对目的图片进行维度与内容的组合重建，输出生成的高分辨率图像。对比SRCNN网络与同类算法进行的高分辨率图像重构，结果如图8所示:

图8a 对相同的图像使用不同超分辨率方法重构

图8b 常见超分辨重构方法的PSNR和SSIM标准评估如图8所示，相同条件下SRCNN网络的SSIM和PSNR值绝大多数情况下优于传统算法，说明SRCNN网络的编码质量相对传统算法有所提升。与传统超分辨算法相比，SRCNN网络具有结构原理简单、重构质量高等优点，不足之处在于图像的转换重构速率较低。

FSRCNN：FSRCNN网络同样由SRCNN开发团队提出，目的是针对SRCNN网络图像转换速率低的缺点进行改进。改进后网络的图像转换速率较SRCNN网络大幅提升，图像重构质量稍有提升。FSRCNN网络对SRCNN网络添加的改变总结如下:

维度变换上: 原始SRCNN网络从图片输入网络开始即对其进行插值变换，以完成与目的图像维度匹配的维度拓展。这样使得网络开头增加的张量维度参与到端与端间的所有变换运算，大大增加了网络计算复杂度和运算开销。改进后的FSRCNN网络将维度拓展的结构放置于网络终端，避免了引入网络内部的非必要运算消耗，提高了图像的转换速率。运算结构上: FSRCNN改进了特征映射中的非线性映射方式，并且减小了卷积运算时的卷积核维度，结果使得网络运算和特征提取的参数数量大幅减少、图像的高分辨率重构效率大为提升。由于网络内部结构的改变，FSRCNN重构图像质量相对SRCNN略有提升。FSRCNN与SRCNN的对比结果如图9所示，改进后FSRCNN网络编码质量和效率相对传统SRCNN网络均有所提升。

图9a SRCNN与FSRCNN的结构对比

图9b FSRCNN与SRCNN的质量及效率对比

二．深度学习中的图像处理应用

当前深度学习在图像处理方面的应用和发展主要归纳为三方面:图像变换、图像识别和图像生成，分别从这三方面进行介绍:

1. 图像变换

指对图片进行的常规操作，包括图像缩放、复制等简单操作和上文提及的去噪、提升超分辨率等常见操作，其目的是提升图片质量，得到理想的目标图片。总体来说，深度学习进行的图像变换依赖于内置工具的强大功能，使用者可根据不同需求学习对应图像处理工具的使用，此处不再赘述。

2. 图像识别

计算机视觉(CV，Computering Version)已成为深度学习领域的重要发展方向，CV的主要内容就是进行目标识别，图像作为生活中的常见目标一直是CV方向研究热点。使用深度学习进行图像识别的通常方法是:构建识别对象为图像的神经网络，达到图像识别的高精度与低运算资源消耗。简要介绍使用神经网络进行图像识别，以2013年Kaggle竞赛提供的猫狗图像集为例，构建图10所示的猫狗图像集识别神经网络:

图10 简单的猫狗图像识别神经网络设定训练轮数epochs为50，对4000张猫狗图像进行分类，得到图像识别网络对猫狗图像集进行训练过程中损失和精度的变化趋势，如图11所示:

图a 图像识别过程中的精度变化

图b 图像识别中的损失变化图11 构建图像识别网络对猫狗数据集的识别结果由图11可知，构建的简单图像识别网络经50轮迭代后，对目标图像集达成了80%以上的识别精度。虽然识别过程中存在过拟合现象，并且识别精度不尽人意，但结果证明神经网络进行图像识别的简便性与可行性。图像过拟合带来的负面影响可以通过减少网络参数量(数据削弱等)和训练图像量等方法减小，目标图像的识别精度可以通过添加预训练模型等方法进行提升。当前神经网络构建的高精度图像识别已广泛应用于人脸识别等智能领域，相关实例可上网查阅自行了解，本文不再赘述。

图12 使用神经网络进行人脸识别的结果

3. 图像生成

图像生成是指从已知图像中学习特征后进行组合，生成新图像的过程。不同于图像的高分辨率重建，图像生成通常需要学习不同图像的特征并进行组合，生成的图像是所有被学习图像特征的结合。常见的图像生成应用包括神经风格迁移、Google公司开发的Deep Dream算法和变分自编码器等，分别介绍如下: 3.1. Deep Dream 由Google公司在2015年夏首次发布，使用早期常见的Caffe架构编写实现，由于其生成的图像布满了算法式的迷幻错觉伪影而引起轰动。DeepDeram生成图像的显著特征是鸟羽毛和狗眼睛数量较多，原因是DeepDream学习的原始图像库为鸟样本和狗样本特别多的ImageNet(Google开源的大型数据库，常用作预训练模型的权重训练)。 Deep Dream与传统的卷积神经网络可视化过程思路相同，均为对卷积神经网络的输入进行梯度上升，以便将靠近网络输出端的某个过滤器可视化；区别在于Deep Dream算法直接从现有的图像提取特征，并且尝试最大化激活神经网络中所有层的激活。使用Deep Dream算法，在Keras框架上对已知图像进行特征迁移，结果如图13所示，Deep Dream生成的图像相对原图增添了许多特征(主要是鸟羽波纹和狗眼睛): 图13a 原始猫图像图13b Deep Dream猫图像图13c 原始狗图像图13d Deep Dream 狗图像图13 使用Deep Dream算法生成的图像 3.2. 神经风格迁移(NST，Neural Style Transfe) 神经风格迁移是指将参考图像的风格应用于目标图像，同时保留目标图像的内容。风格是指图像中不同空间尺度的纹理，颜色和视觉图案，内容则是指图像的高级宏观结构。实现神经风格迁移的思路与寻常深度学习方法相同，均为实现定义损失的最小化。不同于通常的深度学习算法，神经风格迁移的损失函数与图像内容和风格的数学定义有关，具体定义如下式所示：

式中 Loss 代表定义的参考图像与生成图像损失，由 Style 风格损失和 Content 内容损失两部分构成。Style 和 Content 分别定义为风格损失函数和内容损失函数。内容损失函数由神经网络中更靠近顶层的网络激活 L2 范数对参考图像和生成图像计算差值得到，由于选取的网络层更靠近输出端，可认为内容损失函数得到的差值代表目的图像和生成图像中更加全局抽象的图片内容差异。风格损失函数的定义则使用神经网络的多个层，目的是保证风格参考图像和生成图像间在神经网络中各层激活保存相似的内部关系。不同于内容损失函数只关注更全局、更主要的图像内容，风格损失函数需要在网络较高层和较低层保持类似的相互关系，从而在根本上保证参考图片的风格不随特征提取进行而变化。实现神经风格迁移的流程分为三个步骤:

加载预训练网络，创建能够同时计算风格参考图像、目标图像和生成图像预训练网络激活的神经网络。

使用三张图像上计算的对应层激活来定义内容损失与风格损失，得到总体损失函数。

设置批量梯度下降，最小化目标损失。

使用Keras内置的VGG19预训练模型实现神经风格迁移，目标是实现2015年提出的原始神经风格迁移算法，迁移结果如图13所示: 星空原始图像荷池原始图像图14a 实现神经风格迁移的原始图像繁星荷池荷池繁星图14b 交换参考图像和目标图像得到的迁移结果观察图13可知，迁移式神经网络成功完成了风格参考图像到目标图像的风格迁移，并且保留了目标图像的内容。分别以星空和荷池作为参考对象，得到目标图像繁星荷池和荷池繁星。合理选取原始图像和定义迁移参数，就能生成一系列美轮美奂的图像。 3.3 变分式自编码器(VAE,Variational autoencoder) 变分自编码器由Kingma和Welling在2013年12月首次提出，是一种利用深度学习中生成式模型构建的自编码器，特点是将深度学习思想和贝叶斯推断结合在一起，以完成输入目标向低维向量空间的编码映射和向高维向量空间的反解码。经典的图像自编码器首先使用编码器模块编码接收的图像，将其映射到包含图片特征的概念向量构成的潜在向量空间；然后通过解码器模块将其解码为与目标图片同维度大小的输出，经典自编码器的工作流程如图15所示。实践中，由于经典自编码器不具备良好结构的潜在学习空间而常常导致生成图像不连续，未达成对原始训练图像特征的高效提取。变分式自编码器在经典自编码器上基础上改变了其编解码方式，得到学习连续、高度结构化的潜在空间。VAE不是将输入图像压缩成潜在空间中的固定编码，而是将图像转换为统计分布参数(平均值和方差)。然后，VAE使用这两个参数从分布中随机采样一个元素并将其解码到原始输入。这个过程的随机提高了其稳健性，并迫使潜在空间的任何位置都对应有意义的表示，即潜在空间采样的每个点都能解码为有效的输出，变分自编码器的工作流程如图16所示。图像变分自编码器与一般的深度学习模型相同，采用和输入图像相同类型大小的图片来训练模型，以完成对输入图像的特征提取和目标图像的自动重构生成。可以通过指定编码器的输出来限制编码器学习的具体特征。

图15 经典自编码器的工作流程示意图

图16 变分自编码器的工作流程(z_mean和z_log_var分别代表潜在图像通过编码器映射后的均值和方差) 使用mnist数据集作为变分自编码器训练数据集，生成的图像如图17所示:

图17 VAE生成的手写数字图像 3.4 生成式对抗网络(GAN，Generative adversarial network) GAN由Goodfello等人于 2014 年提出，它可以替代VAE来学习图像的潜在空间，其生成的图像与真实图像在统计上几乎无法区分，从而生成相当逼真的合成图像。 GAN结构由一个伪造者网络和一个专家网络组成，二者训练的目的都是为了打败彼此。生成器网络（generator network）以一个随机向量（潜在空间中的一个随机点）作为输入，并将其解码为一张合成图像。判别器网络（discriminator network）又称为对手网络(adversary)，以一张图像（真实或合成均可）作为输入，并预测该图像来自训练集还是生成器网络。训练生成器网络的目的是使其能够欺骗判别器网络，因此随着训练的进行，它能够逐渐生成越来越逼真的图像，即看起来与真实图像无法区分的人造图像，以至于判别器网络无法区分二者。GAN工作流程如图18所示:

图18 GAN网络的训练流程示意图训练GAN和调节GAN实现的过程非常困难,此处不再赘述，读者可自行查阅相关资料了解，使用GAN生成的人脸图像如图19所示:

图19 GAN在人脸图像集上训练生成的图像

三．总结

本文第一部分介绍了深度学习领域中图像处理的常用技巧，主要包括数据增强、图像去噪以及图像增强领域中的图像高分辨率重建技术(SR，Super Resolution)。数据增强能根据原始图像生成内容、风格相似的更多训练图像，可有效解决因训练图像不足带来的曲线过拟合；图像去噪技术的代表是常见的高斯滤波算法和去噪神经网络，其共同特征是有效过滤图片传输中受到的干扰波动，有利于后续的图像处理；图像高分辨率重建是图像增强领域的显著代表，其基本思想是通过提取原始低分辨率图片的特征，变换映射得到高分辨率图片。这种技术不仅完整保留了原始图片的内容和风格(图像的有效信息)，也提升了变换后的图片质量。本文第二部分简要分析深度学习技术在图像处理领域的主要应用，按照不同功能划分为图像变换、图像识别和图像生成三个领域。图像变换是图像处理最简单、基本的操作；图像识别是计算机视觉的重要分支研究领域，目的是达到深度学习图像识别网络识别精度和效率的提升，实际应用于人脸识别和遥感图像识别等方面；最后概述了图像生成应用的几个分支:包括神经风格迁移(NST,Neural Style Transfer)和变分自编码器(VAE，Variational autoencode)等。Deep Dream可以看做训练集为Image Net的神经风格迁移网络，它们的共同特点是:从参考图像中进行内容和风格的提取组合后，根据要求生成不同种类的目标图片。图像生成领域的另一个重要分支为生成式对抗网络(GAN，Generative adversarial network），可以生成与原始图像非常相似的目标图像，感兴趣的读者可以自行了解。图像处理领域是深度学习和机器视觉领域重要的研究分支，相信在未来必将得到蓬勃的发展。本文涉及的图像和代码可在https://github.com/asbfighting/-.git中下载和访问。 参考文献: [1](美)Francois Chollet著，python深度学习[M]，张亮译，北京；人民邮电出版社，2018.8 [2] 候宜军著，Keras深度学习实战[M]，北京；北京图灵文化发展公司，2017,6 [3]Dong, C., Loy, C.C., He, K., Tang, X.: Learning a deep convolutional network for image super-resolution. In: ECCV. (2014) 184–199 [4] Aharon, M., Elad, M., Bruckstein, A.: K-SVD: An algorithm for designing over complete dictionaries for sparse representation. TSP 54(11), 4311–4322 (2006) [5] Burger, H.C., Schuler, C.J., Harmeling, S.: Image denoising: Can plain neural net works compete with BM3D? In: CVPR. pp. 2392–2399 (2012) [6] Freedman, G., Fattal, R.: Image and video upscaling from local self-examples. TOG 30(2), 12 (2011) [7] Yang, J., Lin, Z., Cohen, S.: Fast image super-resolution based on in-place example regression. In: CVPR. pp. 1059–1066 (2013) [8] Dong, C., Loy, C.C., He, K., Tang, X.:Accelerating the Super-Resolution Convolutional Neural (https://Network.In) ECCV.(2016) [9] Dong, C., Loy, C.C., He, K., Tang, X.: Image super-resolution using deep convolutional networks. TPAMI 38(2) (2015) 295–307 [10] Yang, C.Y., Yang, M.H.: Fast direct super-resolution by simple functions. In: ICCV. (2013) 561–568 [11] Timofte, R., De Smet, V., Van Gool, L.: Anchored neighborhood regression for fast example based super-resolution. In: ICCV. (2013) 1920–1927 [12] Gatys L A , Ecker A S , Bethge M . A Neural Algorithm of Artistic Style[J]. Computer Science, 2015. [13] Rezende D J , Mohamed S , Wierstra D . Stochastic Backpropagation and Approximate Inference in Deep Generative Models[J]. 2014. [14] Kingma D P , Welling M . Auto-Encoding Variational Bayes[J]. 2013.

编辑：黄飞

阅读全文

图像处理(55663) 图像处理(55663)
深度学习(119798) 深度学习(119798)

基于深度学习的传统图像增强算法

几个传统的图像增强算法，并给出matlab实现代码，看一看不同算法的实现效果，最后再介绍一下深度学习在图像增强上的应用。 1. 直方图均衡在直方图中，如果灰度级集中于高灰度区域，图像低灰度就不容易分辨，如果灰度级集中于

2020-11-11 16:28:11

5133

图像处理应用中深度学习的重要性分析

作者：Martin Cassel，Silicon Software 工业应用中FPGA 上的神经元网络(CNN) 深度学习应用凭借其在识别应用中超高的预测准确率，在图像处理领域获得了极大关注，这势必

2020-12-13 11:24:53

5768

机器学习技术在图像处理中的应用

在本章中，我们将讨论机器学习技术在图像处理中的应用。首先，定义机器学习，并学习它的两种算法——监督算法和无监督算法；其次，讨论一些流行的无监督机器学习技术的应用，如聚类和图像分割等问题。

2022-10-18 16:08:02

1853

深度学习低光图像增强综述（译）

较差的环境中捕获的图像的感知或可解释性。该领域的最新进展以基于深度学习的解决方案为主，其中采用了许多学习策略、网络结构、损失函数、训练数据等。在本文中，

2023-07-03 14:43:46

1991

深度学习视角下的猫狗图像识别实现

来源：易百纳技术社区，作者：稗子酿的酒人工智能技术在图像识别领域取得了显著进展，其中基于深度学习的图像分类方法在猫狗图像识别中表现出色。本文将介绍使用深度学习技术实现猫狗图像分类的方法，具体

2023-08-15 10:38:30

1621

2017全国深度学习技术应用大会

：面向自然语言处理的深度学习方法及应用　　报告人：陈恩红中国科学技术大学　　报告摘要：深度学习在人工智能领域受到了广泛关注，并在图像、语音上都取得了很大的突破。本次报告将回顾和讨论深度学习在

2017-03-22 17:16:00

关于fpga的图像处理

各位大虾好，我现在正在做关于fpga的课题。想问问大家用fpga处图像，图片以怎么的方式输入fpga再进行处理。

2013-04-12 11:00:17

关于labview对24位图像处理的问题，求高手指点、、、

labview中通过“还原像素图 VI”，可以得到1、4、8、24位像素图，他们的输出都是二维的数组。譬如图像深度为8，数组可包含256个元素，如图像深度为4，数组可包含16个元素，如图像深度为1

2012-11-24 01:14:58

关于实时处理图像

哪位大神知道如何实时的采集图像并进行图像处理（比如我用grab.vi实时采集图像，在这个过程中我能对实时采集到的图像进行处理如滤波，边缘检测等），求大神告知

2017-06-06 21:10:40

深度学习中的IoU概念

深度学习中的IoU概念理解

2020-05-29 09:24:28

深度学习中的图片如何增强

深度学习中的图片增强

2020-05-28 07:03:11

深度学习中的机器视觉（网络压缩、视觉问答、可视化等）

一些可视化的手段以理解深度卷积神经网络。直接可视化第一层滤波器由于第一层卷积层的滤波器直接在输入图像中滑动，我们可以直接对第一层滤波器进行可视化。可以看出，第一层权重关注于特定朝向的边缘以及特定色彩组合

2019-07-21 13:00:00

深度学习DeepLearning实战

一：深度学习DeepLearning实战时间地点：1 月 15日— 1 月18 日二：深度强化学习核心技术实战时间地点： 1 月 27 日— 1 月30 日(第一天报到授课三天；提前环境部署电脑

2021-01-09 17:01:54

深度学习介绍

的“深度”层面源于输入层和输出层之间实现的隐含层数目，隐含层利用数学方法处理（筛选/卷积）各层之间的数据，从而得出最终结果。在视觉系统中，深度（vs.宽度）网络倾向于利用已识别的特征，通过构建更深

2022-11-11 07:55:50

深度学习在医学图像分割与病变识别中的应用实战

地观察和分析。然而，医学图像常常具有复杂的结构、噪声干扰和不同的病变特征，使得传统的图像处理方法难以取得令人满意的结果。基于深度学习的方法通过学习大量数据中的特征表示，能够更好地应对这些挑战。深度学习

2023-09-04 11:11:23

深度学习在汽车中的应用

目标最终结果的培训和验证。完成此操作后，针对嵌入式处理器的工具可将前端工具的输出转换为可在该嵌入式器件上或该嵌入式器件中执行的软件。TI深度学习（TIDL）框架（图3）支持在TI TDAx汽车处理器上

2019-03-13 06:45:03

深度学习在预测和健康管理中的应用

深度学习在预测和健康管理中的应用综述摘要深度学习对预测和健康管理（PHM）引起了浓厚的兴趣，因为它具有强大的表示能力，自动化的功能学习能力以及解决复杂问题的一流性能。本文调查了使用深度学习在PHM

2021-07-12 06:46:47

深度学习存在哪些问题？

深度学习常用模型有哪些？深度学习常用软件工具及平台有哪些？深度学习存在哪些问题？

2021-10-14 08:20:47

深度学习是什么

创客们的最酷“玩具”　　智能无人机、自主机器人、智能摄像机、自动驾驶……今年最令硬件创客们着迷的词汇，想必就是这些一线“网红”了。而这些网红的背后，几乎都和计算机视觉与深度学习密切相关。　　深度学习

2021-07-19 06:17:28

深度强化学习实战

2021-01-10 13:42:26

FPGA视频图像处理的学习

想学习FPGA视频图像处理，不知道该如何着手，有没大神指导迷津，或者有什么这方面的书籍推荐的！

2015-07-28 21:35:31

IMAQ图像处理

各位大神有没有图像处理中关于图像的边缘检测方面的例子。就是测量图像边缘的圆、圆弧、长度、夹角之类的。还有就是有没有曲线拟合方面的资料。

2014-03-18 09:45:57

LabVIEW自带深度学习，冻结Tensorflow完成深度学习。资料下载

浏览不同的图像。最小得分阈值输入，它确定要覆盖在图像显示上的缺陷。硬件和软件要求LabVIEW完整开发系统64位2018或更高版本视觉模块2018或更高版本实现或执行代码的步骤运行深度学习对象检测

2020-07-29 17:41:31

MATLAB图像处理及机器学习入门交流

深度学习交流大群： 372526178 （课件资料共享，加群备注杨春娇邀请）MATLAB与机器学习大群: 626611806 （加群备注杨春娇邀请）

2018-09-12 10:44:56

Nanopi深度学习之路(1)深度学习框架分析

学习，也就是现在最流行的深度学习领域，关注论坛的朋友应该看到了，开发板试用活动中有【NanoPi K1 Plus试用】的申请，介绍中NanopiK1plus的高大上优点之一就是“可运行深度学习算法的智能

2018-06-04 22:32:12

TDA4对深度学习的重要性

深度学习是机器学习的一个子集，常用于自然语言处理，计算机视觉等领域，与众不同之处在于，DL（Deep Learning ）算法可以自动从图像、视频或文本等数据中学习数据特征。DL可以直接从数据中学习

2022-11-03 06:53:11

labview+yolov4+tensorflow+openvion深度学习

：图像预处理步骤繁多且具有强烈的针对性，鲁棒性差；多种算法计算量惊人且无法精确的检测缺陷的大小和形状。而深度学习可以直接通过学习数据更新参数，避免了人工设计复杂的算法流程，并且有着极高的鲁棒性和精度

2021-05-10 22:33:46

labview深度学习PCB插件光学检测

`labview在检测PCBA插件的错、漏、反等缺陷中的应用检测原理通过高精度彩色工业相机不停板实时抓取板卡图像，采取卷积神经网络算法处理图像，智能判定元器件不良。采用最新的深度学习算法对电容，光耦，二极管等训练模型，能兼容不同pcb板，不同环境。`

2021-07-13 15:27:47

labview实现深度学习，还在用python？

传统的视觉算法受打光以及图像的边缘对比度影响，无法做到人眼的分辨效果，而且人具有学习能力，经过大量样本的学习，人就可以找到不同物体之间的细微差别，从而分辨出物体的类别。CNN就是模拟人的大脑

2020-07-23 20:33:10

什么是深度学习？

深度学习是什么意思

2020-11-11 06:58:03

什么是深度学习？使用FPGA进行深度学习的好处？

) 来解决更复杂的问题，深度神经网络是一种将这些问题多层连接起来的更深层网络。这称为深度学习。目前，深度学习被用于现实世界中的各种场景，例如图像和语音识别、自然语言处理和异常检测，并且在某些情况下，它

2023-02-17 16:56:59

什么是人工智能、机器学习、深度学习和自然语言处理？

、情感分析和情感分析。计算机视觉是另一个相关的学科。计算机视觉旨在复制人类的视觉，它涉及到场景识别、物体识别、物体分类、特征提取、手势识别和手势检测的图像处理。计算机视觉从人工智能和机器学习中吸取了许多

2022-03-22 11:19:16

做实时的图像处理应该怎么选择芯片

本人想做数字图像处理方面的课题，不知道DSP和FPGA的器件怎么选择，希望有经验的大神给点建议，我做的这个课题是用FPGA和DSP处理图像 dsp作为主处理器，负责主要的算法，FPGA负责从处理

2012-08-06 10:53:09

全网唯一一套labview深度学习教程：tensorflow+目标检测：龙哥教你学视觉—LabVIEW深度学习教程

在某些特定的应用中已经取得了较好的效果，但仍然存在许多不足。例如：图像预处理步骤繁多且具有强烈的针对性，鲁棒性差；多种算法计算量惊人且无法精确的检测缺陷的大小和形状。而深度学习可以直接通过学习数据更新

2020-08-10 10:38:12

基于深度学习和3D图像处理的精密加工件外观缺陷检测系统

检测，检测准确性和检测稳定性较差、容易误判。基于深度学习和3D图像处理的精密加工件外观缺陷检测系统创新性结合深度学习以及3D图像处理办法，利用非接触式三维成像完成精密加工件的外观缺陷检测，解决行业

2022-03-08 13:59:00

基于深度学习技术的智能机器人

图像分析软件。其中硬件负责获取特定条件下的理想图像，软件负责获取图像中的有用信息。基于机器学习的模式识别系统三、深度学习在图像处理中的应用图像处理技术包括图像预处理和数据分析两部分，图像预处理指的是

2018-05-31 09:36:03

基于深度学习的监督图像分类算法研究，MATLAB制作的。求助：程序代码修改补充，有偿

关键词:图像检索;深度学习;哈希算法;

2019-04-01 16:12:24

实战视觉图像处理：LabVIEW二值化结果显示与对比

LabVIEW之Yolov3+tensorflow深度学习教程》点击了解课程详情：http://url.elecfans.com/u/8d673fae39人工智能AI到来，工业上很多学员不了解C#中

2020-12-09 14:53:37

数字信号处理应该怎么学习？

看到有很多人询问DSP怎么学习，我也有同样的经历和疑问，首先数字信号处理这门课怎么学习？有过来人可以指导一下么

2014-01-02 21:18:36

浅谈深度学习之TensorFlow

DNN（深度神经网络算法）现在是AI社区的流行词。最近，DNN 在许多数据科学竞赛/Kaggle 竞赛中获得了多次冠军。自从 1962 年 Rosenblat 提出感知机（Perceptron）以来

2020-07-28 14:34:04

计算机视觉/深度学习领域常用数据集汇总

的，不能直接以图像格式查看，不过很容易找到将其转换成图像格式的工具。最早的深度卷积网络LeNet便是针对此数据集的，当前主流深度学习框架几乎无一例外将MNIST数据集的处理作为介绍及入门第一教程，其中

2018-08-29 10:36:45

讨论纹理分析在图像分类中的重要性及其在深度学习中使用纹理分析

1、如何在深度学习结构中使用纹理特征　　如果图像数据集具有丰富的基于纹理的特征，如果将额外的纹理特征提取技术作为端到端体系结构的一部分，则深度学习技术会更有效。　　预训练模型的问题是，由于模型

2022-10-26 16:57:26

阿里云与WPS深度合作，开放数据处理生态

第一家被官方Hadoop社区接纳为缺省的对象存储文件系统。此次合作落地，标志着阿里云存储开放的数据湖体系不但面向计算引擎，还面向应用开放。通过阿里云智能媒体管理产品，对象存储OSS面向视频处理应用，图像

2018-04-18 14:11:36

【北交大-图像处理与机器学习】27.图像形态学处理应用视频#图像处理

图像处理人工智能

Amy艾美发布于 2022-01-11 17:39:49

【北交大-图像处理与机器学习】48.深度学习网络#图像处理

图像处理人工智能

Amy艾美发布于 2022-01-11 18:30:45

[3.3.1]--3.3基于深度学习的图像超分辨率重建之神经网络

图像处理视频图像处理深度学习

jf_75936199发布于 2023-04-10 23:45:37

[3.4.1]--3.4基于深度学习的图像超分辨率重建_clip001

图像处理视频图像处理深度学习

jf_75936199发布于 2023-04-10 23:46:18

[3.4.1]--3.4基于深度学习的图像超分辨率重建_clip002

图像处理视频图像处理深度学习

jf_75936199发布于 2023-04-10 23:47:00

[9.3.1]--9.3高光谱图像处理

图像处理视频图像处理深度学习

jf_75936199发布于 2023-04-11 00:12:56

[11.2.1]--11.2图像预处理技术

图像处理视频图像处理深度学习

jf_75936199发布于 2023-04-11 00:29:37

[1.5.1]--1.5.1图像处理应用领域学习视频

图像处理图像识别

jf_75936199发布于 2023-04-28 01:07:36

新芯片架构瞄准深度学习和视觉处理

深度学习本质上是以一组算法为基础，透过具有多个处理层、由线性与非线性交易组成的深度绘图，尝试在数据中建模高层级抽象。ThinCI架构的独特之处似乎就在于其处理深度绘图的方式。

2016-11-03 15:17:55

1782

图像分类的方法之深度学习与传统机器学习

实际情况非常复杂，传统的分类方法不堪重负。现在，我们不再试图用代码来描述每一个图像类别，决定转而使用机器学习的方法处理图像分类问题。目前，许多研究者使用CNN等深度学习模型进行图像分类；另外，经典的KNN和SVM算法

2017-09-28 19:43:49

深度学习在图像超清化的应用

深度学习的出现使得算法对图像的语义级操作成为可能。本文即是介绍深度学习技术在图像超清化问题上的最新研究进展。深度学习最早兴起于图像，其主要处理图像的技术是卷积神经网络，关于卷积神经网络的起源，业界

2017-09-30 11:15:17

深度学习与自然语言处理的工作概述及未来发展

深度学习是机器学习的一个领域，研究复杂的人工神经网络的算法、理论、及应用。自从2006年被Hinton等提出以来［1］，深度学习得到了巨大发展，已被成功地应用到图像处理、语音处理、自然语言处理等多个

2017-10-13 10:59:20

深度学习是什么？无人驾驶攻克三大识别技术不在话下

深度学习在无人驾驶领域主要用于图像处理，也就是摄像头上面。当然也可以用于雷达的数据处理，但是基于图像极大丰富的信息以及难以手工建模的特性，深度学习能最大限度的发挥其优势。现在介绍一下全球摄像头

2018-04-30 01:17:00

2836

图像识别中的深度学习

现阶段比较受欢迎的图像识别基础算法为深度学习法，深度学习模型属于神经网络，而神经网络的历史可追溯至上世纪四十年代，曾经在八九十年代流行。神经网络试图通过模拟大脑认知的激励，解决各种机器学习的问题。

2018-05-25 15:59:31

4678

深度学习高效化与专用处理芯片设计

在人工智能领域，机器学习研究与芯片行业的发展，即是一个相因相生的过程。自第一个深度网络提出，深度学习历经几次寒冬，直至近年，才真正带来一波AI应用的浪潮，这很大程度上归功于GPU处理芯片的发展。

2018-06-22 09:55:58

5938

如何使用OpenCV、Python和深度学习在图像和视频中实现面部识别?

Face ID 的兴起带动了一波面部识别技术热潮。本文将介绍如何使用 OpenCV、Python 和深度学习在图像和视频中实现面部识别，以基于深度识别的面部嵌入，实时执行且达到高准确度。

2018-07-17 16:20:28

7776

如何使用英特尔深度学习SDK解决问题

了解如何使用英特尔®深度学习SDK轻松插入，训练和部署深度学习模型，以解决图像和文本分析问题。

2018-11-08 06:25:00

2992

有哪些小技巧可以改进图像处理开发

Adam Taylor讨论了使用Zynq®和Zynq UltraScale +™SoC开发图像处理应用程序时学到的一些技巧

2018-11-30 06:37:00

2023

深度学习在图像识别领域的四大方向

图像识别技术的高价值应用就发生在你我身边，例如视频监控、自动驾驶和智能医疗等，而这些图像识别最新进展的背后推动力是深度学习。深度学习的成功主要得益于三个方面：大规模数据集的产生、强有力的模型的发展

2018-12-01 08:54:29

30973

深度学习进军太空领域——卫星实时图像识别

的图像、并根据地表特性的不同将地表分割的结果分为九大类，包括绿地，沙漠，海洋，云和外太空等。这是首次使用深度学习在太空中进行实时的图像识别。

2019-01-23 10:23:23

4841

探析深度学习中的各种卷积

在信号处理、图像处理和其它工程/科学领域，卷积都是一种使用广泛的技术。在深度学习领域，卷积神经网络（CNN）这种模型架构就得名于这种技术。但是，深度学习领域的卷积本质上是信号/图像处理领域内的互相关（cross-correlation）。这两种操作之间存在细微的差别。

2019-02-26 10:01:05

3093

如何在图像处理中应用深度学习技术的详细资料概述

深度学习应用凭借其在识别应用中超高的预测准确率，在图像处理领域获得了极大关注，这势必将提升现有图像处理系统的性能并开创新的应用领域。

2019-03-30 11:31:50

4201

pictureprocess简单的QT图形图像处理应用程序免费下载

本文档的主要内容详细介绍的是pictureprocess简单的QT图形图像处理应用程序免费下载。图像处理系统是一个典型的图像处理软件，它由图像显示、图像转换、图像处理、字符识别、其他和帮助等几部分组成。

2019-06-03 08:00:00

深度学习真的好吗

对深度学习近期取得的进展，从事图像处理研究的人可谓厌恶和妒忌参半。

2019-07-03 10:43:37

4879

深度学习能使细胞和基因图像变得怎样

卷积神经网络的深度学习使计算机更加有效、全面的处理图像，生物学领域正在逐渐运用这一技术，它能使细胞、基因等图像更加清晰，使机器看到更多人类从未见过的东西。

2019-07-11 16:20:57

488

使用多孔卷积神经网络解决机器学习的图像深度不准确的方法说明

针对在传统机器学习方法下单幅图像深度估计效果差、深度值获取不准确的问题，提出了一种基于多孔卷积神经网络（ACNN）的深度估计模型。首先，利用卷积神经网络（CNN）逐层提取原始图像的特征图；其次，利用

2019-10-30 14:58:36

深度学习怎么实现图像到图像的翻译

图像到图像的翻译是一类视觉和图形问题，其目标是学习输入图像和输出图像之间的映射。它可以应用到广泛的应用程序中，例如收集样式转移，对象变形，季节转移和照片增强。

2020-05-04 18:12:00

3899

深度学习技术在医疗图像诊断中有什么样的应用

电子发烧友网站提供《深度学习技术在医疗图像诊断中有什么样的应用.pdf》资料免费下载

2020-11-26 05:47:00

深度学习中图像分割的方法和应用

分析和分类以及机器人和自动驾驶车辆的图像处理等应用上。许多计算机视觉任务需要对图像进行智能分割，以理解图像中的内容，并使每个部分的分析更加容易。今天的图像分割技术使用计算机视觉深度学习模型来理解图像的每个像素

2020-11-27 10:29:19

2859

详解深度学习之图像分割

基于人工智能和深度学习方法的现代计算机视觉技术在过去10年里取得了显著进展。如今，它被用于图像分类、人脸识别、图像中物体的识别、视频分析和分类以及机器人和自动驾驶车辆的图像处理等应用上。

2021-01-06 15:50:23

3432

机器学习和深度学习有什么区别？

深度学习算法现在是图像处理软件库的组成部分。在他们的帮助下，可以学习和训练复杂的功能;但他们的应用也不是万能的。 “机器学习”和“深度学习”有什么区别？在机器视觉和深度学习中，人类视觉的力量和对视

2021-03-12 16:11:00

7763

基于深度学习的图像修复模型及实验对比

图像修复是计算机视觉领域中极具挑战性的硏究课题。近年来，深度学习技术的发展推动了图像修复性能的显著提升，使得图像修复这一传统课题再次引起了学者们的广泛关注。文章致力于综述图像修复研究的关键技术。由于

2021-04-08 09:38:00

基于模板、检索和深度学习的图像描述生成方法

描述技术的发展历程为主线，对图像描述任务的方法、评价指标和常用数据集进行了详细的综述。针对图像描述任务的技术方法，总结了基于模板、检索和深度学习的图像描述生成方法，重点介绍了基于深度学习的图像描述的多种方法

2021-04-23 14:07:34

浅谈关于深度学习方法的图像分割

许多计算机视觉任务需要对图像进行智能分割，以理解图像中的内容，并使每个部分的分析更加容易。今天的图像分割技术使用计算机视觉深度学习模型来理解图像的每个像素所代表的真实物体，这在十年前是无法想象

2021-07-06 10:50:35

1981

使用深度学习进行三维图像处理

什么是三维图像处理？三维图像处理是指通过几何变换、滤波、图像分割和其他形态学运算，对三维图像数据进行可视化、处理和分析。三维图像处理常用于医学成像中，对来自 MRI 或 CT 扫描等射线照相来源

2021-11-05 17:43:20

2900

Linux应用开发【第二章】图像处理应用开发

文章目录 2 图像处理应用开发 2.1 BMP图像处理 2.1.1 BMP文件格式解析 2.1.2 代码实现：将BMP文件解析为RGB格式，在LCD上显示 2.2 JPEG图像处理 2.2.1

2021-12-10 17:40:09

484

FPGA图像处理应用详细介绍

FPGA图像处理应用详细介绍

2022-02-28 10:29:49

什么是基于深度学习的超分辨率

基于深度学习的超分辨率是将学习的上采样（up-sampling）函数应用于图像的过程，目的是增强图像中现有的像素数据或生成合理的新像素数据，从而提高图像的分辨率。

2022-05-24 09:33:17

2118

基于深度学习的图像去模糊算法及应用

当前，绝大部分基于深度学习的图像去模糊算法是不区分场景的，也就是他们是对常见的自然与人为设计的场景进行去模糊。但是，在现实生活中，经常会遇到一些特定场景的图像去模糊。比如人脸去模糊、文本去模糊、双目去模糊。本文总结了这些不同场景的特点，以及各自的深度去模糊算法。

2022-10-28 16:00:20

1740

使用HPEC促进深度学习技术

　　期待已久的机器学习时代终于到来了。深度学习技术对作战人员的潜在好处既巨大又深远。随着防御系统趋向于更大的应用程序自主性，深度学习技术过于复杂，无法用更传统的处理技术实现，现在可以帮助显着推动

2022-11-02 09:48:53

471

分享5个用于图像处理的Python库

图像处理是操纵图像以从中提取特征的现象。在当今计算机视觉和深度学习的世界中，大量使用不同的图像处理算法对图像数据集进行边缘检测、识别和分类。有时，这些算法也会逐帧应用于视频，以从中

2023-02-08 16:23:23

1030

经典计算机视觉或基于图像的深度学习问题探索

如果将图像输入深度学习模型，则必须使用批归一化等技术对图像进行归一化，这将有助于标准化网络的输入。这将有助于网络学习得更快、更稳定。批量归一化有时也会减少泛化误差。

2023-04-12 08:59:00

100

悉尼大学最新综述：深度学习图像抠图

自深度学习出现之后，研究者设计出了多种多样的基于卷积神经网络的解决方案。和传统方法一样，早期的深度学习方法依然需要依赖一定量的人工辅助信息，例如三分图（trimap），涂抹（scribble），背景图像等等

2023-04-20 09:31:43

401

理解如何处理计算机视觉和深度学习中的图像数据

在过去几年从事多个计算机视觉和深度学习项目之后，我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时，甚至可能不需要深度学习模型，经过一些处理后一个简单的分类器可能就足够了。

2023-04-26 11:57:12

458

深度学习中的图像分割

深度学习可以学习视觉输入的模式，以预测组成图像的对象类。用于图像处理的主要深度学习架构是卷积神经网络(CNN)，或者是特定的CNN框架，如AlexNet、VGG、Inception和ResNet。计算机视觉的深度学习模型通常在专门的图形处理单元(GPU)上训练和执行，以减少计算时间。

2023-05-05 11:35:28

729

如何使用机器学习处理图像

图像处理是利用复杂的算法对图像进行技术分析。在图像处理中，图像是输入，有用的信息是输出。据报道，到2021年，图像处理行业产值将达到389亿美元。

2023-07-24 15:00:31

418

深度学习的七种策略

深度学习的七种策略深度学习已经成为了人工智能领域的热门话题，它能够帮助人们更好地理解和处理自然语言、图形图像、语音等各种数据。然而，要想获得最好的效果，只是使用深度学习技术不够。要获得最好的结果

2023-08-17 16:02:53

1167

深度学习算法简介深度学习算法是什么深度学习算法有哪些

。深度学习算法作为其中的重要组成部分，不仅可以为诸如人工智能、图像识别以及自然语言处理等领域提供支持，同时也受到了越来越多的关注和研究。在本文中，我们将着重介绍深度学习算法，包括其是什么和有哪些种类。一、什么是

2023-08-17 16:02:56

6010

什么是深度学习算法？深度学习算法的应用

。在深度学习中，使用了一些快速的算法，比如卷积神经网络以及深度神经网络，这些算法在大量数据处理和图像识别上面有着非常重要的作用。深度学习领域的发展不仅仅是科技上的颠覆，更是对人类思维模式的挑战。虽然深度学习

2023-08-17 16:03:04

1305

深度学习服务器怎么做深度学习服务器diy 深度学习服务器主板用什么

。因此，深度学习服务器逐渐成为了人们进行深度学习实验的必要工具。本文将介绍深度学习服务器的DIY，并讨论如何选择主板。一、深度学习服务器的DIY 1.选择适合的处理器深度学习对处理器的要求非常高，因为训练一个深度学习模型需要进行

2023-08-17 16:11:29

489

OpenCV库在图像处理和深度学习中的应用

本文深入浅出地探讨了OpenCV库在图像处理和深度学习中的应用。从基本概念和操作，到复杂的图像变换和深度学习模型的使用，文章以详尽的代码和解释，带领大家步入OpenCV的实战世界。

2023-08-18 11:33:25

442

关于利用传统图像处理方法瑕疵检测总结

最近做图像处理与识别相关的事情，先从OpenCV/Matlab入手，看传统算法在瑕疵检测方向能做到什么程度。　　因之前并没有相关的经验，乍开始生怕闭门造车，遂多方搜寻，相关的会议与论述很多，不乏深度学习或者深度学习与传统算法相结合的，以有限的资源来看，深度学习并没有特别大的优势：表现在

2023-11-20 15:19:17

350

GPU在深度学习中的应用与优势

学习中究竟担当了什么样的角色？又有哪些优势呢？一、GPU加速深度学习训练并行处理GPU的核心理念在于并行处理。在深度学习训练过程中，需要处理大量的数据。GPU通过

2023-12-06 08:27:37

610

已全部加载完成

搜索历史

关于深度学习中的图像处理应用

评论