从代码设计到应用开发，入坑深度学习看这本书就够了-电子发烧友网

深度学习（Deep Learning）是机器学习中一种基于对数据进行表征学习的方法。近年来，深度学习已经在科技界、工业界日益广泛地应用。随着全球各领域多样化数据的极速积累和计算资源的成熟化商业服务，深度学习已经成为人工智能领域最有效的方法。

目前，深度学习技术在语音识别、图像分类、商品推荐等各应用领域不断刷新着智能处理水平纪录。但是与此同时，深度学习模型难以解释，参数调优困难，参数规模大训练周期长等问题也困扰着研究和开发人员。

当下介绍深度学习的书籍很多，但是《深度学习实战》一书视角不同，它重在实践，内容全面。《深度学习实战》英文版由O'REILLY出版社出版，中文版由机械工业出版社出版，作者Douwe Osinga曾供职于Google公司，是深度学习研究及实践方面的一位资深专家。

、

点击封面查看书籍详情

在书中，所有的例子都是用Python编写的，并且大部分代码的实现都依赖于优秀的Keras框架，每章的代码存放在一个notebook中，可以从网站下载学习。在实例章节，每章针对一种技术应用场景，从数据获取技巧开始，接着是几个完成本章目标的技巧和一个数据可视化的技巧。

文本处理领域

词嵌入是自然语言处理的基本方法，我们首先在第3章将使用预先训练好的词嵌入模型计算单词相似性，然后展示一些有趣的Word2vec数学特性，探索如何对高维空间进行可视化，接下来利用Word2vec等词嵌入的语义特性进行特定领域中的排名。

推荐系统在商业领域应用广泛，它基于先前收集到的用户评级数据进行训练。我们在第4章会使用新训练的嵌入来预测电影的评论分数，基于维基百科传出链接（outgoing link）构建一个简单的电影推荐系统。

循环神经网络是一类善于处理时间或序列的重要神经网络，在文本处理中应用广泛，我们在第5章使用RNN根据文本风格生成类似莎士比亚风格的文本，并对RNN的工作进行可视化。

智能客服会应用问答系统，其中关键一环是文本问题匹配，在第6章我们使用来自Stack Exchange网站的数据来构建整个问题的词嵌入，然后使用Pandas从这些嵌入来匹配查找类似的文档或问题。

在社交网络中人们会为给定的一小段文本来推荐适用的表情符号，在第7章我们使用Twitter API实现推文收集，用贝叶斯分类器来阐述基线性能，还介绍卷积模型以及组合模型及模型调优方法。

之后，在第8章我们将介绍序列神经网络来学习文本片段之间的转换，从古腾堡项目（Project Gutenberg）的19世纪小说中提取对话，并利用seq2seq工具包来训练聊天机器人。

图像处理领域

深度学习技术在图像识别和计算机视觉领域产生了比较深远的影响。在图像分类任务中，数十层（有时超过一百层）的神经网络已被证明十分有效，训练这样的网络需要极佳的处理能力和海量的训练图像。

在第9章我们将介绍如何加载预训练网络（该网络是Keras提供的五个预训练网络之一），研究图像输入网络之前所需要预处理过程，展示如何运行网络的推理模式。针对其他任务的新数据进行部分的重新训练也涵盖了迁移学习(transfer learning)概念。

在网络搜索中，可能有人会采取以图搜图模式。在第10章我们构建通过实例图片来搜索图的搜索引擎，我们研究如何查询维基数据（Wikidata），并从维基百科中获取适合的基础图片集开始着手。然后，我们将使用预训练网络为每个图片赋值，我们将研究主成分分析（principal components analysis，PCA）作为可视化展现图与图之间关系的一种方法。

在现实世界中，我们往往需要从一幅图像中检测提取多个目标对象的信息，这是图像处理中经典任务，也是一个十分活跃的研究领域，在Keras上的Python notebook中重现其中最先进的算法较为棘手。

在第11章我们使用Faster RCNN进行训练完成目标检测任务，Faster RCNN在用于训练图像分类器的同一个特征图上并行训练区域建议模型，而不是单独处理区域建议问题。

使用计算机来“魔术”渲染图像很有趣，在第12章我们将探讨一些用于可视化展现卷积网络进行图像分类时所见内容的技术。

然后，我们将介绍尺度（octaves）、深度梦想（deep dreaming）技术、格拉姆矩阵（gram matrices）等，之后，我们进一步将这种技术应用于现有图像，并采用文森特·梵高的名画《星空》的绘画风格渲染照片，使用两种样式的图像渲染同一张图片，从而获得一个两种风格之间的渲染结果。

基于实例生成图像是一个热门的研究领域，在该领域中每月都会涌现出新想法和新突破。

在第13章，我们将研究一个略有局限性的领域：手绘草图，从Google的Quick Draw数据集开始着手，建立一个能够学习“猫属性”的自编码器模型。我们还研究条件变分自编码器（conditional variational autoencoders），它在训练时会考虑图像标签，因此能够以随机样式再现特定类的图像。

在线搜索“免费图标”可以得到很多搜索结果。但是，这些结果并不是真正免费的（即没有任何使用限制的免费使用），大部分结果只是让用户感觉好像不需要花钱。此外，你还不能免费地重用这些图标，并且通常情况下网站会强烈建议你购买它们。

因此，在第14章，我们使用条件变分自编码器、生成式对抗网络（generative adversarial network，GAN）、RNN三种深度网络生成图标，从如何下载、提取，并将图标处理成可使用的标准格式。

音乐处理

语音识别和语音合成技术使得亚马逊Alexa和GoogleHome成为可能，然而，语音处理任务实际上是在亚马逊、Google或苹果的数据中心运行的，因此我们还不认为这些是真正的深度学习试验。尽管Mozilla的深度语音（Deep Speech）已取得了令人瞩目的进步，建立最先进的语音识别系统还是十分困难的。

第15章关注的重点是音乐，我们从训练音乐分类器模型开始，该模型可以告诉我们正在听的是什么音乐。然后，我们使用模型结果建立本地MP3索引，使用Spotfy API建立公开播放列表语料库，并用该库建立音乐推荐系统。

最后，该书在第16章介绍了在实际生产系统中使用模型的内容，让模型在真实的服务器或移动设备上运行。

近年，全球人工智能研究机构、研究院相继成立，深度学习成为人工智能的核心必备工具。对于深度学习研究人员，特别是应用开发工程师而言，如何摆脱深度学习模型的“黑盒”困境、如何让深度学习模型设计更加简洁高效、如何将深度学习快速地应用到具体的业务领域，该书进行了详细的介绍及代码示例，在每个实例场景，作者还提供具有重要价值的实践经验提点。读者如果想要进一步了解相关内容，可以参阅该书相关部分。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

代码

代码

+关注

关注
30

文章
4780

浏览量
68539
深度学习

深度学习

+关注

关注
73

文章
5500

浏览量
121118
数据可视化

数据可视化

+关注

关注
0

文章
465

浏览量
10251

原文标题：从代码设计到应用开发，入坑深度学习看这本书就够了

文章出处：【微信号：rgznai100，微信公众号：rgznai100】欢迎添加关注！文章转载请注明出处。

【「大模型启示录」阅读体验】对本书的初印象

阅读这本书，我能够对大模型有一个全面而深刻的理解。期待通过阅读这本书，能够获得启发，将大模型的力量应用到我的学习和未来的工作中。

发表于 12-16 14:05

《DNESP32S3使用指南-IDF版_V1.6》第一章本书学习方法

：1，坚持循序渐进的思路编写，从基础到入门，从简单到复杂。2，将知识进行分类介绍，简化学习过程，包括：基础篇、入门篇、提高篇。3，将板卡硬件资源介绍独立成一个文档（《ESP32-S3

发表于 11-20 09:54

在学习go语言的过程踩过的坑

作为一个5年的phper，这两年公司和个人都在顺应技术趋势，新项目慢慢从php转向了go语言，从2021年到现在，笔者手上也先后开发了两个go项目。在学习go语言的过程中也

发表于 11-11 09:22 •160次阅读

FPGA做深度学习能走多远？

、高效的开发工具和编程模型，降低 FPGA 的开发门槛，吸引更多的开发者参与到 FPGA 在深度学习

发表于 09-27 20:53

【「OpenHarmony开发与实践 | 基于红莓RK2206开发板」阅读体验】一点小小的意见

也许是我的错觉这本书从几本的编译安装开始教学。似乎定位偏向入门。但是后面确实不太入门，尤其是对于各种移植操作。也许是主创团队给大家的一个备忘录吧。书中确实有很多内容没有成功展开，很多对新手来说

发表于 09-26 22:32

新书推荐 | TSMaster开发从入门到精通

书名：TSMaster开发从入门到精通书号：9787302667193作者：杨金升刘矗刘功申定价：99.80元《CANoe开发从入门

发表于 08-30 12:37 •507次阅读

《DNK210使用指南 -CanMV版 V1.0》第一章本书学习方法

，坚持循序渐进的思路讲解，从基础到入门，从简单到复杂；2，将知识进行分类介绍，简化学习过程；3，将板卡硬件资源介绍独立成一个文档《DNK210硬件参考手册.pdf》。因此，读者在

发表于 08-28 17:57

【「时间序列与机器学习」阅读体验】+ 鸟瞰这本书

这本书不仅内容丰富，而且当我打开它时，它还带有一种特殊的含义--页面上的签名来自一次温暖的社区活动。这些签名充当了作者、读者和整个学习社区之间的纽带，见证了知识的转移和成长的乐趣。本书目录结构

发表于 08-12 11:28

【「时间序列与机器学习」阅读体验】+ 简单建议

简单评价这本书。是这样，在阅读与实践过程中，我也发现了一些可以进一步提升用户体验的细节之处。例如，书中大量的代码示例对于学习者来说无疑是宝贵的资源，但在快速复制粘贴的过程中，偶尔会出现因格式或符号

发表于 08-12 11:21

PyTorch深度学习开发环境搭建指南

PyTorch作为一种流行的深度学习框架，其开发环境的搭建对于深度学习研究者和开发者来说至关重要

发表于 07-16 18:29 •1003次阅读

深度学习算法在嵌入式平台上的部署

随着人工智能技术的飞速发展，深度学习算法在各个领域的应用日益广泛。然而，将深度学习算法部署到资源受限的嵌入式平台上，仍然是一个具有挑战性的任

发表于 07-15 10:03 •1339次阅读

《软件开发珠玑》+60条戒律

井70%都出现过。早学习到，能避免少走很多的弯路，节约更多的时间和精力。如果没学习的软件工作者能看到、认真阅读这本书。肯定能有大收获。该书能指导今后的工作，不仅是软件方面，其它的也能应

发表于 06-24 19:27

【《软件开发珠玑》阅读体验】+ 心得

【《软件开发珠玑》阅读体验】+ 心得感谢电子发烧友论坛提供的读书机会。读这本书使我在编程方面多了位资深老师。在软件项目开发领域的时，我阅读了《软件开发珠玑》

发表于 06-23 17:56

【RTC程序设计：实时音视频权威指南】新书一瞥

应用，为开发者提供了完整的RTC解决方案。首先RTC 是一个涉及音视频编解码、网络传输、实时交互等多个领域的复杂技术。希望能通过这本书从基础知识开始，逐步深入到高级应用和系统设计。

发表于 04-22 09:09

PSoC CAN不会从深度睡眠中醒来是怎么回事？

亲爱的论坛：我们用 PSoC6 开发了嵌入式软件。但是我们遇到了以下问题：在某些主板上，PSoC6 CAN无法从深度睡眠中醒来。我们通过以下方法开发了

发表于 01-31 08:03

搜索历史

从代码设计到应用开发，入坑深度学习看这本书就够了

评论

【「大模型启示录」阅读体验】对本书的初印象

《DNESP32S3使用指南-IDF版_V1.6》第一章本书学习方法

在学习go语言的过程踩过的坑

FPGA做深度学习能走多远？

【「OpenHarmony开发与实践 | 基于红莓RK2206开发板」阅读体验】一点小小的意见

新书推荐 | TSMaster开发从入门到精通

《DNK210使用指南 -CanMV版 V1.0》第一章本书学习方法

【「时间序列与机器学习」阅读体验】+ 鸟瞰这本书

【「时间序列与机器学习」阅读体验】+ 简单建议

PyTorch深度学习开发环境搭建指南

深度学习算法在嵌入式平台上的部署

《软件开发珠玑》+60条戒律

【《软件开发珠玑》阅读体验】+ 心得

【RTC程序设计：实时音视频权威指南】新书一瞥

PSoC CAN不会从深度睡眠中醒来是怎么回事？