八种主流深度学习框架的介绍-电子发烧友网

导读：近几年随着深度学习算法的发展，出现了许多深度学习框架。这些框架各有所长，各具特色。常用的开源框架有TensorFlow、Keras、Caffe、PyTorch、Theano、CNTK、MXNet、PaddlePaddle、Deeplearning4j、ONNX等。

框架名称：TensorFlow

主要维护方：Google

支持的语言：C++/Python/Java/R 等

框架名称：Keras

主要维护方：Google

支持的语言：Python/R

框架名称：Caffe

主要维护方：BVLC

支持的语言：C++/Python/Matlab

框架名称：PyTorch

主要维护方：Facebook

支持的语言：C/C++/Python

框架名称：Theano

主要维护方：UdeM

支持的语言：Python

框架名称：CNTK

主要维护方：Microsoft

支持的语言：C++/Python/C#/.NET/Java/R

框架名称：MXNet

主要维护方：DMLC

支持的语言：C++/Python/R等

框架名称：PaddlePaddle

主要维护方：Baidu

支持的语言：C++/Python

框架名称：Deeplearning4j

主要维护方：Eclipse

支持的语言：Java/Scala等

框架名称：ONNX

主要维护方：Microsoft/ Facebook

支持的语言：Python/R

下面开始对各框架进行概述，让读者对各个框架有个简单的认知，具体的安装及使用方法不在本文赘述。

01 TensorFlow

谷歌的TensorFlow可以说是当今最受欢迎的开源深度学习框架，可用于各类深度学习相关的任务中。TensorFlow = Tensor + Flow，Tensor就是张量，代表N维数组；Flow即流，代表基于数据流图的计算。

TensorFlow是目前深度学习的主流框架，其主要特性如下所述。

TensorFlow支持Python、JavaScript、C ++、Java、Go、C＃、Julia和R等多种编程语言。

TensorFlow不仅拥有强大的计算集群，还可以在iOS和Android等移动平台上运行模型。

TensorFlow编程入门难度较大。初学者需要仔细考虑神经网络的架构，正确评估输入和输出数据的维度和数量。

TensorFlow使用静态计算图进行操作。也就是说，我们需要先定义图形，然后运行计算，如果我们需要对架构进行更改，则需要重新训练模型。选择这样的方法是为了提高效率，但是许多现代神经网络工具已经能够在学习过程中改进，并且不会显著降低学习速度。在这方面，TensorFlow的主要竞争对手是PyTorch。

RStudio提供了R与TensorFlow的API 接口，RStudio官网及GitHub上也提供了TensorFlow扩展包的学习资料。

02 Keras

Keras是一个对小白用户非常友好且简单的深度学习框架。如果想快速入门深度学习， Keras将是不错的选择。

Keras是TensorFlow高级集成API，可以非常方便地和TensorFlow进行融合。Keras在高层可以调用TensorFlow、CNTK、Theano，还有更多优秀的库也在被陆续支持中。Keras的特点是能够快速搭建模型，是高效地进行科学研究的关键。

Keras的基本特性如下：

高度模块化，搭建网络非常简洁；

API简单，具有统一的风格；

易扩展，易于添加新模块，只需要仿照现有模块编写新的类或函数即可。

RStudio提供了R与Keras的API接口，RStudio的官网及GitHub上也提供了Keras扩展包的学习资料。

03 Caffe

Caffe是由AI科学家贾扬清在加州大学伯克利分校读博期间主导开发的，是以C++/CUDA代码为主的早期深度学习框架之一，比TensorFlow、MXNet、PyTorch等都要早。Caffe需要进行编译安装，支持命令行、Python和Matlab接口，单机多卡、多机多卡等都可以很方便使用。

Caffe的基本特性如下。

以C++/CUDA/Python代码为主，速度快，性能高。

工厂设计模式，代码结构清晰，可读性和可拓展性强。

支持命令行、Python和Matlab接口，使用方便。

CPU和GPU之间切换方便，多GPU训练方便。

工具丰富，社区活跃。

同时，Caffe的缺点也比较明显，主要包括如下几点。

源代码修改门槛较高，需要实现正向/反向传播。

不支持自动求导。

不支持模型级并行，只支持数据级并行。

不适合非图像任务。

虽然Caffe已经提供了Matlab和Python接口，但目前不支持R语言。caffeR为Caffe提供了一系列封装功能，允许用户在R语言上运行Caffe，包括数据预处理和网络设置，以及监控和评估训练过程。该包还没有CRAN版本，感兴趣的读者可以在GitHub找到caffeR包的安装及使用的相关内容。

04 PyTorch

PyTorch是Facebook团队于2017年1月发布的一个深度学习框架，虽然晚于TensorFlow、Keras等框架，但自发布之日起，其受到的关注度就在不断上升，目前在GitHub上的热度已经超过Theano、Caffe、MXNet等框架。

PyTroch主要提供以下两种核心功能：

支持GPU加速的张量计算；

方便优化模型的自动微分机制。

PyTorch的主要优点如下。

简洁易懂：PyTorch的API设计相当简洁一致，基本上是tensor、autograd、nn三级封装，学习起来非常容易。

便于调试：PyTorch采用动态图，可以像普通Python代码一样进行调试。不同于TensorFlow，PyTorch的报错说明通常很容易看懂。

强大高效：PyTorch提供了非常丰富的模型组件，可以快速实现想法。

05 Theano

Theano诞生于2008年，由蒙特利尔大学的LISA实验室开发并维护，是一个高性能的符号计算及深度学习框架。它完全基于Python，专门用于对数学表达式的定义、求值与优化。得益于对GU的透明使用，Theano尤其适用于包含高维度数组的数学表达式，并且计算效率比较高。

因Theano出现的时间较早，后来涌现出一批基于Theano的深度学习库，并完成了对Theano的上层封装以及功能扩展。在这些派生库中，比较著名的就是本书要学习的Keras。Keras将一些基本的组件封装成模块，使得用户在编写、调试以及阅读网络代码时更加清晰。

06 CNTK

CNTK（Microsoft Cognitive Toolkit）是微软开源的深度学习工具包，它通过有向图将神经网络描述为一系列计算步骤。在有向图中，叶节点表示输入值或网络参数，其他节点表示其输入上的矩阵运算。

CNTK允许用户非常轻松地实现和组合流行的模型，包括前馈神经网络（DNN）、卷积神经网络（CNN）和循环神经网络（RNN、LSTM）。与目前大部分框架一样，CNTK实现了自动求导，利用随机梯度下降方法进行优化。

CNTK的基本特性如下。

CNTK性能较好，按照其官方的说法，它比其他的开源框架性能都要好。

适合做语音任务，CNTK本就是微软语音团队开源的，自然更适合做语音任务，便于在使用RNN等模型以及时空尺度时进行卷积。

微软开发的CNTK-R包提供了R与CNTK的API接口。

07 MXNet

MXNet框架允许混合符号和命令式编程，以最大限度地提高效率和生产力。MXNet的核心是一个动态依赖调度程序，可以动态地自动并行化符号和命令操作。其图形优化层使符号执行更快，内存效率更高。

MXNet的基本特性如下。

灵活的编程模型：支持命令式和符号式编程模型。

多语言支持：支持C++、Python、R、Julia、JavaScript、Scala、Go、Perl等。事实上，它是唯一支持所有R函数的构架。

本地分布式训练：支持在多CPU/GPU设备上的分布式训练，使其可充分利用云计算的规模优势。

性能优化：使用一个优化的C++后端引擎实现并行I/O和计算，无论使用哪种语言都能达到最佳性能。

云端友好：可直接与S3、HDFS和Azure兼容。

08 ONNX

ONNX（Open Neural Network eXchange，开放神经网络交换）项目由微软、亚马逊、Facebook和IBM等公司共同开发，旨在寻找呈现开放格式的深度学习模型。ONNX简化了在人工智能不同工作方式之间传递模型的过程，具有各种深度学习框架的优点。

ONNX的基本特性如下。

ONNX使模型能够在一个框架中进行训练并转移到另一个框架中进行预测。

ONNX模型目前在Caffe2、CNTK、MXNet和PyTorch中得到支持，并且还有与其他常见框架和库的连接器。

onnx-r包提供了R与ONNX的API接口。

关于作者：谢佳标，资深AI技术专家和数据挖掘专家，拥有超过14年的技术研发和管理经验。精通Python和Keras等深度学习框架，在数据挖掘和人工智能技术领域有非常深厚的积累。连续6年（2017~2022年）被微软评为数据科学和AI方向MVP。资深R语言技术专家，“中国现场统计研究会大数据统计分会”第一届理事。历届中国R语言和数据科学大会特邀演讲嘉宾，受邀在国内多所高校举行以数据主题的公益讲座。

审核编辑：符乾江

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

深度学习

深度学习

+关注

关注
73

文章
5521

浏览量
121679
迁移学习

迁移学习

+关注

关注
0

文章
74

浏览量
5597

军事应用中深度学习的挑战与机遇

，并广泛介绍了深度学习在两个主要军事应用领域的应用：情报行动和自主平台。最后，讨论了相关的威胁、机遇、技术和实际困难。主要发现是，人工智能技术并非无所不能，需要谨慎应用，同时考虑到其局限性、网络安全威胁以及

发表于 02-14 11:15 •144次阅读

BP神经网络与深度学习的关系

BP神经网络与深度学习之间存在着密切的关系，以下是对它们之间关系的介绍：一、BP神经网络的基本概念 BP神经网络，即反向传播神经网络（Backpropagation Neural Network

发表于 02-12 15:15 •178次阅读

NPU在深度学习中的应用

设计的硬件加速器，它在深度学习中的应用日益广泛。 1. NPU的基本概念 NPU是一种专门针对深度学习算法优化的处理器，它与传统的CPU和G

发表于 11-14 15:17 •1036次阅读

GPU深度学习应用案例

GPU在深度学习中的应用广泛且重要，以下是一些GPU深度学习应用案例：一、图像识别图像识别是深度学习

发表于 10-27 11:13 •551次阅读

AI大模型与深度学习的关系

AI大模型与深度学习之间存在着密不可分的关系，它们互为促进，相辅相成。以下是对两者关系的介绍：一、深度学习是AI大模型的基础技术支撑：

发表于 10-23 15:25 •1543次阅读

NVIDIA推出全新深度学习框架fVDB

在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。

发表于 08-01 14:31 •713次阅读

PyTorch深度学习开发环境搭建指南

PyTorch作为一种流行的深度学习框架，其开发环境的搭建对于深度学习研究者和开发者来说至关重要

发表于 07-16 18:29 •1361次阅读

深度学习中的时间序列分类方法

时间序列分类（Time Series Classification, TSC）是机器学习和深度学习领域的重要任务之一，广泛应用于人体活动识别、系统监测、金融预测、医疗诊断等多个领域。随着深度

发表于 07-09 15:54 •1244次阅读

深度学习与nlp的区别在哪

深度学习和自然语言处理（NLP）是计算机科学领域中两个非常重要的研究方向。它们之间既有联系，也有区别。本文将介绍深度学习与NLP的区别。

发表于 07-05 09:47 •1100次阅读

深度学习常用的Python库

深度学习作为人工智能的一个重要分支，通过模拟人类大脑中的神经网络来解决复杂问题。Python作为一种流行的编程语言，凭借其简洁的语法和丰富的库支持，成为了深度

发表于 07-03 16:04 •759次阅读

TensorFlow与PyTorch深度学习框架的比较与选择

深度学习作为人工智能领域的一个重要分支，在过去十年中取得了显著的进展。在构建和训练深度学习模型的过程中，深度

发表于 07-02 14:04 •1154次阅读

深度学习模型训练过程详解

详细介绍深度学习模型训练的全过程，包括数据预处理、模型构建、损失函数定义、优化算法选择、训练过程以及模型的评估与调优。

发表于 07-01 16:13 •1619次阅读

深度学习的模型优化与调试方法

深度学习模型在训练过程中，往往会遇到各种问题和挑战，如过拟合、欠拟合、梯度消失或爆炸等。因此，对深度学习模型进行优化与调试是确保其性能优越的关键步骤。本文将从数据预处理、模型设计、超参

发表于 07-01 11:41 •1066次阅读

深度解析深度学习下的语义SLAM

随着深度学习技术的兴起，计算机视觉的许多传统领域都取得了突破性进展，例如目标的检测、识别和分类等领域。近年来，研究人员开始在视觉SLAM算法中引入深度学习技术，使得

发表于 04-23 17:18 •1434次阅读

FPGA在深度学习应用中或将取代GPU

将 AI 框架模型映射到硬件架构。 Larzul 的公司 Mipsology 希望通过 Zebra 来弥合这一差距。Zebra 是一种软件平台，开发者可以轻松地将深度学习代码移植到 F

发表于 03-21 15:19

搜索历史

八种主流深度学习框架的介绍

评论

军事应用中深度学习的挑战与机遇

BP神经网络与深度学习的关系

NPU在深度学习中的应用

GPU深度学习应用案例

AI大模型与深度学习的关系

NVIDIA推出全新深度学习框架fVDB

PyTorch深度学习开发环境搭建指南

深度学习中的时间序列分类方法

深度学习与nlp的区别在哪

深度学习常用的Python库

TensorFlow与PyTorch深度学习框架的比较与选择

深度学习模型训练过程详解

深度学习的模型优化与调试方法

深度解析深度学习下的语义SLAM

FPGA在深度学习应用中或将取代GPU