电子发烧友网>人工智能>Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升 - 全文

Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升 - 全文

Mathworks 推出了包含 MATLAB 和 Simulink 产品系列的 Release 2017b（R2017b），该版本大大加强了 MATLAB 对深度学习的支持，并简化了工程师、研究人员及其他领域专家设计、训练和部署模型的方式。该更新版本从数据标注、模型搭建、训练与推断还有最后的模型部署方面完整地支持深度学习开发流程。此外，MATLAB 这次更新最大的亮点是新组件 GPU Coder，它能自动将深度学习模型代码转换为 NVIDIA GPU 的 CUDA 代码，GPU Coder 转换后的 CUDA 代码可以脱离 MATLAB 环境直接高效地执行推断。经 MATLAB 内部基准测试显示，GPU Coder 产生的 CUDA 代码，比 TensorFlow 的性能高 7 倍，比 Caffe2 的性能高 4.5 倍。

媒体采访了中国资深应用工程师陈建平，陈建平从 MATLAB 中的数据标注开始沿着深度学习模型的开发、训练、调试到最后使用 GPU Coder 部署高性能模型，为我们介绍了 MATLAB 这一次更新针对深度学习所做的努力。本文将沿着 MATLAB 深度学习开发过程简要介绍这次更新的要点，同时重点向大家展示能自动将模型转化为 CUDA 代码的 GPU Coder 模块。

数据标注

对于计算机视觉来说，Computer Vision System Toolbox 中的 Ground Truth Labeler app 可提供一种交互式的方法半自动地标注一系列图像。除了目标检测与定位外，该工具箱现在还支持语义分割，它能对图像中的像素区域进行分类。陈建平说：「我们现在的标注工具可以直接半自动地完成任务，它可以像 Photoshop 中的魔棒工具一样自动标注出像素层级的类别，我们选中图片后工具会自动将对象抠出来。在我们完成初始化的图像语义分割后，工具会使用自动化的手段把后续行驶过程中的其它元素都抠出来。因为中间和后续过程都是以机器为主导完成的，所以我们只需要在前期使用少量的人力就能完成整个标注过程。」

这种半自动方法确实可以大大提升标注的效率，特别是标注车道边界线和汽车边界框等视觉系统目标。在这种自动标注框架下，算法可以快速地完成整个数据集的标注，而随后我们只需要少量的监督与验证就能构建一个精确的数据集。如下所示，MATLAB 文档向我们展示了如何创建车道线自动标注。

Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升

我们可以使用不同的算法，如能自动检测车道线特征的 Auto Lane Detection、使用聚合通道特征（Aggregate Channel Features/ACF）检测车辆的 ACF Vehicle Detector 和使用 Kanade-Lucas_Tomasi（KLT）在小间隔内追踪一个或多个 ROI 的算法等。如果我们选择自动算法，那么接下来设置 ROI、最大车道数、车道线宽度等参数后就可以直接运行自动标注。若视频经过人工微调与校验，并达到不错的效果，我们就可以选择「Accept」完成标注任务。

模型构建

在模型构建方面，Neural Network Toolbox 增加了对复杂架构的支持，包括有向无环图（DAG）和长短期记忆（LSTM）网络等，并提供对 GoogLeNet 等流行的预训练模型的访问方式。陈建平表示：「其实 MATLAB 在 2016 年的时候就已经支持一些深度学习模型，而现在不仅支持 VGGNet 和 GoogleNet 等流行的预训练模型，同时还支持使用 Caffe Model Importer 直接从 Caffe 中导入。」

因为我们可以直接从 Caffe Model Zoo 中导入各种优秀与前沿的模型，所以 MATLAB 在模型方面可以提供广泛的支持。但直接从 Caffe 中导入模型又会产生一个疑惑，即如果我们在 Python 环境下使用 Caffe 构建了一个模型，那么导入 MATLAB 是不是需要转写代码，会不会需要做一些额外的工作以完成导入？对此，陈建平解答到：「假设我们使用 Python 和 Caffe 完成了一个模型，并保存以 Caffe 格式，那么 Caffe Model Importer 会直接从保存的 Caffe 格式中读取模型。在这个过程中，Caffe 并不需要为 MATLAB 做额外的工作，所有的转换结果都是 MATLAB 完成的。」

在导入模型后，我们可以直接使用类似于 Keras 的高级 API 修改模型或重建模型。下面将简要介绍如何导入预训练 AlexNet，并修改完成迁移学习。

首先我们需要导入 AlexNet，如果 Neural Network Toolbox 中没有安装 AlexNet，那么软件会提供下载地址。

　　net = alexnet;

　　net.Layers

上面的语句将导入 AlexNet，并如下所示展示整个 CNN 的神经网络架构。其中 MATLAB 会展示所有的操作层，每一层都给出了层级名、操作类型和层级参数等关键信息。例如第二个操作层『conv1』表示一个卷积运算，该运算采用了 96 个卷积核，每一个卷积核的尺寸为 11×11×3、步幅为 4，该卷积运算采用了 padding。

这种描述不仅有利于我们了解整个神经网络的架构，同时还有助于调整架构以匹配特定的任务。由上可知最后的全连接层、softmax 层和分类输出层是与 ImageNet 任务相关联的配置，因此我们需要去除这三个层级并重新构建与当前任务相关联的层级。MATLAB 可以十分简洁地实现这一过程：

Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升

由上面的代码可知我们只提取了 AlexNet 预训练模型的前 22 层，而后依次新建了全连接层、softmax 层和分类输出层。完成整个层级重构后，剩下的就只需使用以下代码训练新的模型。其中 trainingImages 为当前任务的训练样本、layers 为前面修正的层级，而 options 是我们设置的一组训练参数，包括优化算法、最小批量大小、初始化学习率、绘制训练过程和验证集配置等设定。

netTransfer = trainNetwork（trainingImages，layers，options）;

由上，我们发现 MATLAB 的深度学习代码非常简洁，调用高级 API 能快速完成模型的搭建。陈建平说：「MATLAB 上的高级 API 是一个完整的体系，它们完全是针对深度学习而设计的。当然我们还是会用基础的运算，因为 MATLAB 这么多年的累积可以充分体现在基础运算上，但是深度学习这一套高级 API 确实是新设计的。」

其实不只是 AlexNet，很多 Caffe 模型都能够导入到 MATLAB。那么，MATLAB 为什么会选择 Caffe 作为对接的深度学习框架，而不是近来十分流行的 TensorFlow？

陈建平解释说：「MATLAB 选择 Caffe 其实是有很多历史原因的，因为 Caffe 在 CNN 上做得非常好，传统上它在图像方面就是一个非常优秀的框架，从这个角度我们优先选择了 Caffe 作为支持的深度学习框架。当然，MATLAB 在很快也会有针对 TensorFlow 的导入功能。」

训练与推断

对于模型训练来说，最重要的可能就是能支持大规模分布式训练。因为目前的深度模型都有非常多的参数和层级，每一次正向或反向传播都拥有海量的矩阵运算，所以这就要求 MATLAB 能高效地执行并行运算。当然，我们知道 MATLAB 在并行运算上有十分雄厚的累积，那么在硬件支持上，目前其支持 CPU 和 GPU 之间的自动选择、单块 GPU、本地或计算机集群上的多块 GPU。此外，由于近来采用大批量 SGD 进行分布式训练的方法取得了十分优秀的结果，我们可以使用 MATLAB 调用整个计算机集群上的 GPU，并使用层级对应的适应率缩放（Layer-wise Adaptive Rate Scaling/LARS）那样的技术快速完成整个模型的训练。

在模型训练中，另外一个比较重要的部分就是可视化，我们需要可视化整个训练过程中的模型准确度、训练损失、验证损失、收敛情况等信息。当然 MATLAB 一直以来就十分重视可视化，在上例执行迁移学习时，我们也能得到整个训练过程的可视化信息。如下所示，上部分为训练准确度和验证准确度随迭代数的变化趋势，下部分为训练损失和验证损失随迭代数的变化趋势，该迁移学习基本上到第 3 个 epoch 就已经收敛。

Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升

陈建平说：「训练是十分重要的，尤其是对关注算法本身的研究者。但如果我们考虑模型部署，那么也许推断会变得更加重要。」

对于推断来说，新产品 GPU Coder 可自动将深度学习模型转换为 NVIDIA GPU 的 CUDA 代码。内部基准测试显示，GPU Coder 产生的 CUDA 代码，比 TensorFlow 的性能提高 7 倍，比 Caffe2 的性能提高 4.5 倍。

陈建平说：「其实我们将 MATLAB 和其它框架做了一些基准对比，MATLAB 在测试中比 TensorFlow 快 2.5 倍，比 Caffe 快 40% 左右。而我们还有一种方法让模型的推断速度变得更快，也就是使用 GPU Coder 将模型转化为脱离 MATLAB 环境的 CUDA 代码。我们已经在一台 GPU 工作站上测试 GPU Coder 的效果，基本上它要比 TensorFlow 的性能高 7 倍，比 Caffe2 的性能高 4.5 倍。实际上在转换代码时我们剔除了很多额外的交互过程。其实 GPU Coder 对产品部署是十分有用的，因为 CUDA 代码对需要考虑很多限制的嵌入式系统十分重要，例如 CUDA 代码能高效地控制嵌入式系统的功耗。」

下图展示了内部基准测试的结果：

Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升

该测试使用 TitanXP GPU 和 Intel（R） Xeon（R） CPU E5-1650 v4 @ 3.60GHz 对 AlexNet 的推断性能进行了内部基准测试。使用的软件版本或框架是 MATLAB（R2017b）、TensorFlow（1.2.0）和 Caffe2（0.8.1）。每个软件或框架都是使用 GPU 加速版来进行基准测试，所有测试均在 Windows 10 上运行。

模型部署

在 MATLAB 部署模型其实也很简单，MATLAB 很早就支持生成独立于其开发环境的其它语言，比如利用 MATLAB Coder 可以将 MATLAB 代码转换为 C 或 C++代码。而该最新版提供了新的工具 GPU Coder，我们能利用它将生成的 CUDA 代码部署到 GPU 中并进行实时处理，这一点对于应用场景是极其重要的。

Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升

GPU 代码生成其实在 MATLAB 中也十分简单，陈建平不仅利用车道线识别模型向我们演示了如何使用 GPU Coder 生成高效的 CUDA 代码，同时还展示了在脱离 MATLAB 环境下运行 CUDA 代码进行推断的效果。

陈建平说：「本质上车道线识别模型是通过迁移学习完成的，只不过在模型训练完成后，我们既不会直接在 CPU 上运行模型并执行推断，也不会单纯地通过 MATLAB 环境编译推断过程。因此我们可以通过 GPU Coder 和几行语句基于已训练的模型来产生 CUDA 代码。我们需要告诉 GPU Coder 各种信息，例如我们需要产生的外接包装是 C++、目标是产生一个 CUDA 库文件等。因为 C++ 需要定义严格的数据类型，所以在我们输入参数的信息后，Coder 会递归地推导输入所涉及的所有数据类型。最后 GPU Coder 会根据这些信息产生 CUDA 代码。」

Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升

左图为GPU Coder app，右图展示了生成的CUDA代码

如果 GPU Coder 能将模型转化为 CUDA 代码，那么它到底是如何将一个串行设计的模型转换为并行的 CUDA 代码？

陈建平解释说：「推断过程本质上是一个并行过程，而推断的每一步我们可以认为是一个独立循环体。而现在我们有办法将这种独立循环体展开成大量的 CUDA 并发线程，这一过程都是自动完成的。其实 MATLAB 有工具能判断 For 循环是不是独立的，如果是的话它就会将这些 For 循环自动并行化。所以 CUDA 其实就是一种超多线程的并发模型，而只有这种并行化才能充分利用 GPU 的计算资源以加快推断速度。」

最后，MATLAB 会自动完成代码的并行化，并转化为高效的 CUDA 代码，因此我们能脱离 MATLAB 环境来执行整个推断过程。

结语

从数据源、模型构建、训练与推断到最终产品的部署，R2017B 补齐了整个开发链条。MathWorks 的 MATLAB 市场营销总监 David Rich 表示，「借助 R2017b，工程和系统集成团队可以将 MATLAB 拓展用于深度学习，以更好地保持对整个设计过程的控制，并更快地实现更高质量的设计。他们可以使用预训练网络，协作开发代码和模型，然后部署到 GPU 和嵌入式设备。使用 MATLAB 可以改进结果质量，同时通过自动化地真值标注 App 来缩短模型开发时间。

阅读全文

上一页 1 2 3 4全文

本文导航

第 1 页：Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升
第 2 页：模型构建
第 3 页：训练与推断
第 4 页：模型部署

MathWorks(61018) MathWorks(61018)
深度学习(119797) 深度学习(119797)

科大讯飞与英伟达深度合作 Tesla P4提供50倍算法速度提升

5月9日美国硅谷报道，今天，科大讯飞在英伟达2017 GTC（GPU技术大会）上宣布，讯飞平台将提供基于英伟达Pascal架构Tesla P4深度学习平台提供语音云服务，进一步提升讯飞语音云平台效率

2017-05-10 09:59:05

3764

2017全国深度学习技术应用大会

`　　深度学习不但使得机器学习能够实现众多的应用，而且拓展了人工智能的领域范围，并使得机器辅助功能都变为可能。其应用领域正在加速渗透到很多领域，也催生了深度学习与其它应用技术的加速融合，为提升一线

2017-03-22 17:16:00

CUDA教程之Linux系统下CUDA安装教程

CUDA教程之1：Linux系统下CUDA安装教程

2020-06-02 16:53:31

MathWorks宣布推出2011b版MATLAB和Simulink

MathWorks日前宣布推出 2011b版 (R2011b) MATLAB 和 Simulink 产品系列。此版本新引入了 Simulink Code Inspector，它可以实现

2011-09-08 15:45:03

MathWorks的AI之路：面向工业场景，打通开发到部署的全链路精选资料分享

解题器的阶段。然而，MATLAB在几年前就已经加入了深度学习的功能，而MATLAB与Simulink的结合，更是进一步扩展了MathWorks在AI领域的使用范围。例如，MathWorks推出的2020a版本，就更新了用于深度学习的扩展AI功能，工程师可以在更新的Deep Net...

2021-07-12 06:26:22

Mathworks.Matlab.R2014a.v8.0.3.Win32_64-ISO 1DVD

Mathworks.Matlab.R2014a.v8.0.3.Win32_64-ISO 1DVDMATLAB 是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境

2014-05-30 15:47:41

cuda可以和特斯拉M10一起使用吗？

/m60-can-it-be-used-for-deep-learning-/我遇到了类似的问题，但它是关于M10的。我用GRID M10-8Q创建了一个虚拟机，我想在进行深度学习时使用cuda加速计算。但是，我在这里找不到特斯拉M10

2018-09-26 15:30:23

推断FP32模型格式的速度比CPU上的FP16模型格式快是为什么？

在 CPU 上推断出 FP32 模型格式和 FP16 模型格式。 FP32 模型格式的推断速度比 FP16 模型格式快。无法确定推断 FP32 模型格式的原因比 CPU 上的 FP16 模型格式快。

2023-08-15 08:03:04

深度学习与数据挖掘的关系

;而深度学习使用独立的层、连接，还有数据传播方向，比如最近大火的卷积神经网络是第一个真正多层结构学习算法，它利用空间相对关系减少参数数目以提高训练性能，让机器认知过程逐层进行，逐步抽象，从而大幅度提升

2018-07-04 16:07:53

深度学习存在哪些问题？

深度学习常用模型有哪些？深度学习常用软件工具及平台有哪些？深度学习存在哪些问题？

2021-10-14 08:20:47

EIA-422-B是否是RS-422A的升级版本？

EIA-422-B是否是RS-422A的升级版本？现在RS-422接口是否指的是EIA-422-B？{:13:}

2014-03-06 18:34:10

HarmonyOSAPP开发-解锁学习升级版练习

一、技术相关卡片语言: Js升级基础：蛟龙腾飞 xuexijiesuo工具：deveco studio二、升级效果如下三、部分代码如下上图为第一个页面的css代码上图为第四个页面的hml代码上图为第

2021-08-24 10:16:48

Matlab R2011b正式完整版下载地址

2012-03-26 23:37:39

Matlab各版本软件下载合辑

Matlab R2017b Win64试用版软件下载Matlab R2017b mac64试用版软件下载Matlab R2017b Linux试用版软件下载Matlab R2017a 软件下载

2012-11-21 22:37:12

NVIDIA火热招聘深度学习 (Deep Learning) 达人

/Shenzhen/Beijing 基本要求:1.熟悉深度学习相关算法以及框架2.有图像识别和检测经验优先3.熟悉计算机体系结构, 有CUDA相关经验优先;

2017-08-25 17:04:24

NVIDIA火热招聘深度学习/高性能计算解决方案架构师

目前NVIDIA在中国热招解决方案架构师, 该岗位致力于协同客户经理将NVIDIA最新的深度学习/高性能计算解决方案与技术带给我们的客户, 帮助客户通过实施NVIDIA技术解决方案来提升整体效率

2017-08-25 17:02:47

Nanopi深度学习之路(1)深度学习框架分析

最耳熟能详的就是TensorFlow，但再稍有了解的，会知道TensorFlow太过于底层，实现深度学习的过程复杂，但其框架是相当好的，Keras相比TensorFlow，具有简单易用的特点，更适合深度学习

2018-06-04 22:32:12

OPPO R9s发布会全程视频录播，没看过的来看看吧！

传感器，首次采用双核对焦技术，前置与后置摄像头均配置1600W像素，拍照成像质量相比R9有了很大的提升。配置方面，R9s搭配4G+64G组合，R9s升级版搭配6G+64G。双机均支持双网通网络制式。处理器

2016-10-20 17:26:50

Py之TFCudaCudnn：Win10下安装深度学习框架Tensorflow+Cuda+Cudnn最简单最快捷最详细攻略

Py之TFCudaCudnn：Win10下安装深度学习框架Tensorflow+Cuda+Cudnn最简单最快捷最详细攻略

2018-12-20 10:35:16

RS-422B问题

EIA-422-B是否是RS-422A的升级版本？现在RS-422接口是否指的是EIA-422-B？{:13:}

2014-03-06 18:35:39

RS-422B问题

EIA-422-B是否是RS-422A的升级版本？现在RS-422接口是否指的是EIA-422-B？{:13:}

2014-03-06 18:38:05

ST25R3916B/17B NFC读卡器介绍

初始概念到产品量产所需的时间也因此得到了极大的缩减。ST25R3916B/17B依托于其前身强大的模拟性能，配备了易于配置的升级版波束成形功能，并扩展了动态功率输出及其他独特功能。

2023-09-08 06:46:41

ST25R3916B与ST25R3911程序与硬件兼容么？如何从ST25R3911升级到ST25R3916B？

您好，请问，ST25R3916B与ST25R3911程序与硬件兼容么？如果想从ST25R3911升级到ST25R3916B需要做些什么？

2023-08-07 14:50:36

[推荐] （不看后悔）Android开发资料分享- 免积分（升级版）

非常好的Android开发资料，大家来看看吧[推荐] （不看后悔）Android开发资料分享- 免积分（升级版）http://www.arm-cn.com/bbs/forum.php?mod=viewthread&tid=231&fromuid=2872(出处: 风火轮技术论坛)

2014-01-09 16:36:16

labview读取USB数据的升级版

本帖最后由 yuxuaa 于 2016-7-20 10:29 编辑 labview读取USB数据的升级版

2016-07-18 16:20:13

matlab ：Warning: Failed to load MathWorks locale database. Using MathWorks default locale setting instead. 这怎么办啊

\MATLAB\R2010b\bin\mex.pl": No such file or directory ??? Error using ==> mex at 208Unable to complete successfully.

2016-12-16 11:04:58

matlab自学一本通（新版软件+基础教程+案例源码）

，该更新版本从数据标注、模型搭建、训练与推断还有最后的模型部署方面完整地支持深度学习开发流程。　　其实，MATLAB2017b本次还有一大亮点是新组件“GPU Coder”，它能自动将深度学习模型代码

2018-12-11 14:29:11

【PYNQ-Z2试用体验】剪枝量化好帮手，深鉴科技Deepin套件DNNDK使用(结项)

caffe模型（浮点），得到int8的模型，再通过sdk编程，直接部署到FPGA上，这个过程本质上应该还是使用了SDSoC的相关工具。大佬们开发了DPU这个深度学习的IP，在不远的将来要放置到

2019-03-21 15:09:29

【海量分享2】Matlab 2008-2017全套安装软件（2017b 2017a 2016a等）+视频+书籍+代码 +教程【火】

第一时间回复您百度网盘地址（记得多刷新几次，网盘有时会不太稳定）。一定是两步哟，不要忘记。4.如果没有收到邮件请给我留言或发邮件。分享内容包括（详细的见图片）：1.Matlab安装软件（含2017b

2018-02-26 22:52:04

【米尔FZ3深度学习计算卡试用体验】FZ3深度学习计算卡总结篇

、板卡芯片资源以下芯片的相关资源表格：对于硬件设计来说，红框中资源是比较重要的，影响着深度学习前向推断的性能和速度，之前帖子也说明了该板卡能够实现的DPU为B2306的lowDSPs，这也就限制了前向推断

2021-01-10 14:39:17

【详解】FPGA：深度学习的未来？

计算的研究者，二是希望为现实世界中的新应用来部署这些模型的应用科学家。然而，他们都面临着一个限制条件，即硬件加速能力仍需加强，才可能满足扩大现有数据和算法规模的需求。对于深度学习来说，目前硬件加速

2018-08-13 09:33:30

上海升级版超级电容公交车投运

`上海升级版超级电容公交车投运2013-02-17 16:09:33 来源: 作者: 【大中小】浏览:55次评论:0条　　早在2006年就在上海市投入公交运营的超级电容公交车，在上海市科委

2013-06-09 16:22:23

上海升级版超级电容公交车投运

　早在2006年就在上海市投入公交运营的超级电容公交车，在上海市科委的支持下，近日完成了技术改造，首批12辆升级版超级电容公交车将陆续在26路公交车线路上投入运行。发展新能源公交车是国家能源环保

2013-03-22 16:23:33

为什么CH579的OTA升级速度是多少？

为什么OTA 方式一升级，速度只有240b/s，官方测试都有1K左右。

2022-07-29 06:39:26

什么是CUDA？

什么是CUDA？

2021-09-28 07:37:20

什么是CUDA？

在大家开始深度学习时，几乎所有的入门教程都会提到CUDA这个词。那么什么是CUDA？她和我们进行深度学习的环境部署等有什么关系？通过查阅资料，我整理了这份简洁版CUDA入门文档，希望能帮助大家用最快

2021-07-26 06:28:15

什么是深度学习？

深度学习是什么意思

2020-11-11 06:58:03

什么是深度学习？使用FPGA进行深度学习的好处？

什么是深度学习为了解释深度学习，有必要了解神经网络。神经网络是一种模拟人脑的神经元和神经网络的计算模型。作为具体示例，让我们考虑一个输入图像并识别图像中对象类别的示例。这个例子对应机器学习中的分类

2023-02-17 16:56:59

什么是深度残差收缩网络？

　　　深度残差收缩网络是深度残差网络的一种新的升级版本，其实是深度残差网络、注意力机制（参照Squeeze-and-Excitation Network，SENet）和软阈值化的深度集成

2020-11-26 06:33:10

从系统建模、算法设计到产品实现一网打尽 | 2017 MATLAB 和 Simulink技术研讨会

技巧、以及Simulink系统仿真与测试和嵌入式软件开发等主题，同时我们将介绍MathWorks的最新技术进展和R2017b 最新特性，参加此次活动，您将快速获得MATLAB 和Simulink在相关领域

2017-09-29 09:32:09

传感器十大综合实验【基础实验的升级版】

传感器十大综合实验【基础实验的升级版】

2016-12-25 16:02:54

动态分配多任务资源的移动端深度学习框架

第一个挑战，NestDNN 部署了一个新的模型剪枝和复原方案（recovery scheme），将深度学习模型转换为紧凑的多容量模型（multi-capacity model）。这一多容量模型由一组

2018-10-31 16:32:24

块集是否可能与R2017B版本不兼容？

块集是否可能与R2017B（DEMO）版本不兼容？我也要传达同样的信息：“Simulink Coder是必须的……”请安装“。但是它在图书馆浏览器的列表中！请帮忙。以上来自于百度翻译以下为原文

2018-11-20 15:39:59

如何提升单片机开发技术？

地优化程序的代码，提高程序的运行效率和响应速度。 4. 不断进行实践和研究，探索新的优化方法和技巧，能够更好地提升自己的技术水平。

2024-01-05 10:14:30

如何提升网口速度？

我用STM32F429裸机测试网口速度，用的ST官方库，修改了LWIP底层发送窗口和缓冲区大小，建立tcp server链接，发送数据再返回给上位机这种方式测试的。收发速度仍然是40K左右字节每秒，怎么提升网口速度？

2019-10-09 21:49:11

干货！教你怎么搭建TensorFlow深度学习开发环境！

操作系统。2017年，TensorFlow终于推出了1.0版本，这标志着应用最广泛、使用人数最多的深度学习算法TensorFlow推出了正式版。目前TensorFlow最新的版本

2018-09-27 13:56:06

怎么购买N9340B频谱分析仪的升级版

我在哪里可以购买N9340B分析仪的升级版？我想启用跟踪生成器等。我知道它只是您购买的许可证密钥吗？如果是这样可以在线完成吗？感谢您的任何信息。以上来自于谷歌翻译以下为原文Where can

2018-12-25 16:13:35

无法运行CUDA示例代码

和Horizon 7.1。我能够在C ++中编译示例CUDA代码（Windows 10. Visual Studio 2015），但在运行时，我得到了一个

2018-09-11 16:33:56

电磁炉电源芯片SM7028升级版SM7028B

` 为顺应广大客户的需求，我司新推电磁炉电源芯片SM7028B，SM7028B是SM7028的升级版，能完全兼容SM7028。另外，SM7028B同时能兼容SM7026。SM7028B是采用电流模式

2016-03-14 15:27:12

笙泉MCU在工控方面的应用(2)

5B32系列其CPU主频提升到了32MHz，系统频率则提升到50MHz，对用户的一些译码或算法运算有很大的速度提升。旧版5B仅支持10位ADC/200K转换率，而升级版5B系列则可达到12位/400K

2023-02-03 15:25:04

请问1期加强版和1期只学习1期加强版可以吗？

1期加强版和1期只学习1期加强版可以吗？1期旧版太乱了。

2019-04-29 07:45:24

谷歌深度学习插件tensorflow

前段时间忙着研究Zedboard，这几天穿插着加入Python的深度学习的研究，最近使用谷歌的tensorflow比较多，而且官方出了中文教程，比较给力，下面在Windows10下安装一下

2018-07-04 13:46:51

郭天祥 mini 80E升级版的蜂鸣器怎么不响呢？？

升级版说明书有原来程序下载后需要特别注意的地方：1、喇叭。mini80e升级版需要多连一根杜邦线，J23的SPEAKER引脚连接到VCC（J4）这个线必须连接，不然喇叭不响可是我找到J4处木有VCC啊，全是GND，连上去之后下了程序也不响，有用过的吗？

2013-04-14 12:19:35

NI发布WLAN测量套件2.0，升级IEEE 802.11n

升级版WLAN软件工具包和多通道RF仪器提升业界最佳测试速度和精度新闻发布——

2010-06-09 16:47:09

607

MathWorks推出基于MATLAB生成HDL代码的产品

MathWorks 近日宣布推出 HDL Coder，该产品支持MATLAB 自动生成 HDL 代码，允许工程师利用广泛应用的 MATLAB 语言实现 FPGA 和 ASIC 设计。

2012-03-07 09:27:18

2033

iPad 2升级版采用32纳米芯片:续航时间提升16%

据美国科技博客AnandTech报道，苹果已经开始出售升级版iPad 2，通过32纳米A5处理器将电池续航能力提升了16%。

2012-05-04 18:02:37

962

立方体升级版源代码

立方体升级版源代码，详细介绍如果制作及软件编程，适合初学者练手用，好东西哦

2015-11-23 11:03:39

NVIDIA深度学习平台

为帮助数据科学家和开发人员充分利用深度学习领域中的机遇，NVIDIA为其深度学习软件平台发布了三项重大更新，它们分别是NVIDIA DIGITS 4、CUDA深度神经网络库(cuDNN)5.1和全新的GPU推理引擎(GIE)。　　 NVIDIA深度学习软件平台推三项重大更新

2016-08-06 15:00:26

1806

联发科Helio X23/27十核发布：Helio X20/25的升级版性能提升解析

联发科正式宣布推出Helio X23和Helio X27两款处理器，我们可以把它们看做是Helio X20和Helio X25的升级版，性能有所提升。

2016-12-02 10:49:33

4316

九张机器学习和深度学习代码速查表分享_初学者必备

本文作者在 Github 上建立了一个代码速查表，对机器学习初学者来说是不可多得的一个资源。对于初学者来讲，入门机器学习和深度学习非常困难；同时深度学习库也难以理解。

2018-06-30 00:52:00

3715

沃尔沃发布全新XC60推Polestar升级版将要到来

车型，而是指Polestar针对全新XC60全系车型提供的性能升级版本，其中最强劲的T8车型的最大功率被提升到了421马力。

2017-07-11 09:05:08

822

山世光谈深度学习生产线、以及中科视拓深度学习算法平台SeeTaaS

中科视拓董事长山世光研究员，在2017钛媒体T-EDGE年度国际盛典上，谈深度学习生产线、以及中科视拓通用深度学习算法平台SeeTaaS。

2017-12-26 13:41:37

4266

对2017年NLP领域中深度学习技术应用的总结

本文作者Javier Couto是tryo labs公司的一名研发科学家，专注于NLP技术。这篇文章是他对2017年NLP领域中深度学习技术应用的总结，也许并不全面，但都是他认为有价值、有意义的成果。Couto表示，2017年是对NLP领域非常有意义的一年，随着深度学习的应用，NLP技术也将继续发展下去。

2017-12-28 10:02:28

5372

深度学习领域Facebook等巨头在2017都做了什么

过去一年间，谷歌、Facebook、微软等巨头加持下，深度学习框架格局发生了极大改变，深度学习领域Facebook等巨头在2017都做了什么，我们一一来解答。

2018-01-02 10:19:57

2594

萤石C6H两小时被抢购一空其升级版即将现身

萤石C6H云台摄像机在天猫聚划算平台上线短短两小时，一万台机器被“抢购一空”，成为名副其实的萤石“爆款”。新品C6H云台摄像机升级版传承了C6H优秀的内在品质，云台转速、云台静音等配置方面的提升令人

2018-03-27 13:31:00

13413

MATLAB R2017b最新版本下载

，该更新版本从数据标注、模型搭建、训练与推断还有最后的模型部署方面完整地支持深度学习开发流程。其实，MATLAB2017b本次还有一大亮点是新组件GPU Coder，它能自动将深度学习模型代码转换为 NVIDIA GPU的CUDA代码，GPU Coder转换后的CUDA代码可以脱离MATLAB 境直接

2018-04-17 18:15:18

MATLAB R2017b Win64官方软件下载

还添加了新的重要的深度学习功能，可简化工程师、研究人员及其他领域专家设计、训练和部署模型的方式。随着智能设备和物联网的发展，设计团队面临创造更加智能的产品和应用的挑战，他们需要自己掌握深度学习技能或依赖其他具有深度学习专长但可能不了解应用场景的团队。借助 R2017b，工程和系统集成

2018-04-17 18:22:27

296

MATLAB R2017b mac64试用软件下载

Mathworks Matlab R2017b for Mac是由Mathworks公司推出的一款著名商业数学软件。而本次，小编带来的是最新版本Matlab R2017b，支持10.12，适用于OS

2018-04-17 18:28:44

215

MATLAB R2017b Linux试用版下载

2018-04-17 18:36:59

MathWorks 在 2018b 版本的 MATLAB 和 Simulink 产品系列中扩展了深度学习功能

关键词：MATLAB , Simulink , 深度学习 MathWorks 今日推出了 2018b 版本的 MATLAB 和 Simulink。该版本包含重要的深度学习增强功能，以及各个产品

2018-09-23 11:10:02

526

深度学习在各个领域有什么样的作用深度学习网络的使用示例分析

深度学习网络作为一个功能多样的工具，虽然最初仅用于图像分析，但它已逐渐被应用到各种不同的任务和领域中。高准确性和高处理速度，使得用户无需成为领域专家即可对大型数据集执行复杂分析。本文邀请 MathWorks 产品经理 Johanna 分享一些深度学习网络的使用示例以供参考

2018-11-25 11:41:44

7260

数据科学家们将能够借助NVIDIA全新CUDA-X AI库实现速度的大幅提升

CUDA-X AI包含十几个专用加速库，能够将机器学习和数据科学工作负载加速至高达50倍。它已经在通过cuDF加速数据分析；通过cuDNN加速深度学习原语；通过cuML加速机器学习算法；通过DALI加速数据处理等。

2019-03-22 15:16:54

2392

Mipsology Zebra在深度学习推断的应用

Zebra 可消除深度学习推断中具有挑战性的编程及 FPGA 任务。Zebra 可轻松部署和适应广泛的神经网络及框架。

2019-07-21 10:59:09

893

MathWorks推出Release 2019b，MATLAB 和 Simulink功能新增

MathWorks宣布推出了 Release 2019b，其中包含一系列的 MATLAB 和 Simulink 新功能，包括对人工智能、深度学习和汽车行业的支持。

2019-09-17 17:10:04

9312

Python深度学习2018的源代码合集免费下载

本文档的主要内容详细介绍的是Python深度学习2018的源代码合集免费下载。

2020-01-16 10:25:00

MathWorks推出具有AI功能的2020a版MATLAB及Simulink

MathWorks推出了2020a版本，具有用于深度学习的扩展AI功能。

2020-05-19 14:46:40

3009

MathWorks与NVIDIA 深度学习学院合作提供《MATLAB 深度学习》全新课程

基于数十年来的复杂工程项目支持经验，MathWorks 为构建 AI 驱动系统提供了一个综合平台。

2020-07-16 15:16:21

1011

CUDA学习笔记第一篇：一个基本的CUDA C程序

1、CUDA的简介 2、GPU架构和CUDA介绍3、CUDA架构4、开发环境说明和配置5、开始第一个Hello CUDA程序 5.1、VS2017创建NVIDIA CUDA项目...

2020-12-14 23:40:27

660

基于深度学习的恶意代码功防研究及进展

深度学习赋能的恶意代码攻防研究已经成为网络安全领域中的热点问题。当前还没有针对这一热点问题的相关综述，为了及时跟进该领域的最新研究成果，本文首先分析并总结了恶意代码攻击的一般流程。基于该攻击流程

2021-04-28 17:23:38

赛灵思Vitis AI为AI推断带来了哪些改变？

，并将底层 FPGA 和 ACAP 的繁复细节抽象化。帮助缺乏专业知识的用户轻松开发深度学习推断应用，再度刷新AI推断的高效性和易用性。想了解Vitis AI为AI推断带来了哪些改变？ Vitis AI的强大功能特性在以高效和易用为核心的设计理念支持下，Vitis AI拥有了经过最

2021-05-17 10:38:07

1911

Ian-2017-《深度学习》英文电子版.pdf

Ian-2017-《深度学习》英文电子版.pdf

2022-01-20 10:08:09

NVIDIA GPU加快深度神经网络训练和推断

深度学习是推动当前人工智能大趋势的关键技术。在 MATLAB 中可以实现深度学习的数据准备、网络设计、训练和部署全流程开发和应用。联合高性能 NVIDIA GPU 加快深度神经网络训练和推断。

2022-02-18 13:31:44

1714

使用深度学习抑制噪声的产生

　　我们使用了 NVIDIA 的 CUDA 库直接在 NVIDIA GPUs 上运行应用程序并执行批处理。下面的代码片段使用 CUDA 执行矩阵乘法。

2022-04-28 15:52:30

2000

何时使用机器学习或深度学习

　　部署到嵌入式 GPU 也很受欢迎，因为它可以在部署的环境中提供快速的推理速度。GPU Coder 支持从 MATLAB 中的深度学习模型生成代码，该模型利用来自 Intel、NVIDIA

2022-07-08 15:23:34

1304

如何在OpenCV中实现CUDA加速

OpenCV4.x中关于CUDA加速的内容主要有两个部分，第一部分是之前OpenCV支持的图像处理与对象检测传统算法的CUDA加速；第二部分是OpenCV4.2版本之后开始支持的针对深度学习卷积神经网络模型的CUDA加速。

2022-09-05 10:03:00

4417

六类网线升级版超六类网线哪些地方升级了-科兰

超六类网线是六类网线的升级版，六类网线升级版超六类网线哪些地方升级了?与六类网线相比，超六类网线的外径更大、质量更重、最小弯曲半径也更大，并且超六类网线的最大传输距离为100m，同时可以和六类

2023-06-14 10:19:53

379

深度学习如何挑选GPU？

NVIDIA的标准库使在CUDA中建立第一个深度学习库变得非常容易。早期的优势加上NVIDIA强大的社区支持意味着如果使用NVIDIA GPU，则在出现问题时可以轻松得到支持。

2023-07-12 11:49:28

399

深度学习是什么领域

深度学习是什么领域深度学习是机器学习的一种子集，由多层神经网络组成。它是一种自动学习技术，可以从数据中学习高层次的抽象模型，以进行推断和预测。深度学习广泛应用于计算机视觉、语音识别、自然语言处理

2023-08-17 16:02:59

995

深度学习框架是什么？深度学习框架有哪些？

深度学习框架是什么？深度学习框架有哪些？深度学习框架是一种软件工具，它可以帮助开发者轻松快速地构建和训练深度神经网络模型。与手动编写代码相比，深度学习框架可以大大减少开发和调试的时间和精力，并提

2023-08-17 16:03:09

1587

用赛灵思FPGA加速机器学习推断

电子发烧友网站提供《用赛灵思FPGA加速机器学习推断.pdf》资料免费下载

2023-09-15 15:02:17

基于Anaconda安装pytorch深度学习环境+pycharm安装---免额外安装CUDA和cudnn

前言最近由于项目需要，之前我们在利用GPU进行深度学习的时候，都要去NVIDIA的官网下载CUDA的安装程序和cudnn的压缩包，然后再进行很繁琐的系统环境配置。不仅环境配置麻烦，而且还特别容易配置

2023-10-10 10:16:40

658

已全部加载完成

搜索历史

Mathworks R2017b升级版,加强深度学习转换CUDA代码推断速度再提升 - 全文

数据标注

模型构建

训练与推断

模型部署

结语

本文导航

评论