一本书来帮助你入门深度学习生成模型-电子发烧友网

如果你想要一本书来帮助你入门深度学习生成模型，那么最新出版的“Generative Deep Learning”一定是不二之选。本书囊括了包括BERT/GPT-2, StyleGAN等近五年来最先进的GAN，带你走进生成模型的奇妙世界。

现在是2019年7月20日UTC时间20:17。

50年前的今天，尼尔·阿姆斯特朗和巴兹·奥尔德林驾驶驾驶的登月舱“鹰”号降落在月球上。这是一项伟大的工程壮举，充满着勇气和坚定的决心。

快进50年，将这些宇航员带到月球表面去的阿波罗制导计算机(AGC)的处理能力就在你的口袋里——事实上，iPhone 6的计算能力就足以引导1.2亿个阿波罗11号飞船登月，而且是在同一时间。

这一事实并没有真正公正地反映AGC的辉煌。由于摩尔定律，你可以选择任何计算机器，也可以说50年后，将会有一台机器能够比它的运行速度快2²⁵倍。

编写AGC代码的软件团队的负责人是玛格丽特·汉密尔顿(Margaret Hamilton)，她没有把那时的硬件限制看作是一种障碍，而是一种挑战。她利用当时可用的资源完成了不可想象的目标。

Margaret Hamilton

这让我想到…

《生成式深度学习》新书

459天前，我收到来自O'Reilly Media的消息，询问我是否有兴趣写一本书。当时我觉得这似乎是个好主意，所以答应了，并决定写一本关于生成模型的最新指南——特别是如何构建最先进的深度学习模型，这样的模型可以绘画、写作、作曲和玩游戏。

更重要的是，我希望这本书能让读者深入了解生成式深度学习，并构建能够做出各种令人惊叹的事情的模型，而不需要大量昂贵且耗时的计算资源。

我很高兴地宣布，这本书现在可以可以通过亚马逊购买，也可以在O’Reilly网站上购买电子版。（注：作者David Foster是Applied Data Science的联合创始人）

我坚信，掌握任何技术的秘诀都是首先解决小问题，但是要了解每一行代码背后的原理。

如果你一开始就搞庞大的数据集和模型，那么会需要一天而不是一个小时的时间来运行，你不会学到更多的东西——只是将学习的速度放慢了24倍。

如果说登月教会了我们什么的话，那就是真正令人惊奇的事情是可以在非常少的计算资源下实现的，我的目标是让你在读完这本书后，对生成模型有同样的感受。

封面的鹦鹉是怎么回事?

为O’Reilly写书最棒的一点是，他们会在你的书的封面上画一只动物——我得到了一只画好的长尾小鹦鹉，我亲切地给它取名为Neil Wingstrong。

长尾小鹦鹉Neil Wingstrong

那么现在鹦鹉已经着陆，你还能从这本书中期待什么呢?

这本书是关于什么的?

这是一本关于生成模型的动手指南。

它将带你了解基本生成模型的基础知识，然后逐步构建更复杂的模型——始终使用实际示例、架构图和代码。

这本书适合任何想要深入了解当前热门的生成模型的人。你不需要深度学习的先验知识，所有代码示例都是用Python编写的。

这本书涵盖哪些内容?

我试图涵盖过去5年来所有的重要生成模型。

如下面的时间轴所示。

全书分为两部分，章节提纲如下:

第一部分：生成式深度学习简介

本书的前四章旨在介绍开始构建生成式深度学习模型所需的核心技术。

1. 生成模型

我们对生成建模领域进行了广泛的研究，并考虑了我们试图从概率角度解决的问题的类型。然后，我们探索了基本概率生成模型的第一个例子，并分析为什么随着生成任务的复杂性增加，可能需要部署深度学习技术。

2. 深度学习

本章将指导你开始构建更复杂的生成模型所需的深度学习工具和技术。我们将介绍Keras，一个用于构建神经网络的框架，可用于构建和训练一些在文献中发表的最先进的深度神经网络架构。

3.变分自动编码器

在本章中，我们将介绍第一个生成深度学习模型——变分自动编码器。这一强大的技术将允许我们从头开始生成逼真的面孔，并改变现有的图像——例如，添加微笑，或改变某人头发的颜色。

4. 生成对抗网络(GANs)

本章探讨了近年来最成功的生成模型技术之一——生成对抗性网络。这个用于构建生成模型问题的优雅框架是大多数最先进的生成模型背后的基础引擎。我们将学习它的微调的方式，从而不断推进生成模型能够实现的边界。

第二部分：教机器绘画、写作、作曲和玩游戏

第二部分提供了一组案例研究，展示了如何将生成建模技术应用于特定的任务。

5. 绘画

在本章中，我们将研究两种与机器绘画有关的技术。首先我们来看看CycleGAN，顾名思义，它是GAN架构的一个改编，允许模型学习如何将照片转换成特定风格的绘画(反之亦然)。我们还探索了包含在许多照片编辑应用程序中的神经风格迁移技术，这种技术允许你将一幅画的风格转移到一张照片上，给人一种这是同一位艺术家的画的印象。

6. 写作

在本章中，我们将注意力转向机器写作，这是一项对图像生成提出不同挑战的任务。本章介绍了递归神经网络(RNN)的结构，它允许我们处理涉及序列数据的问题。我们还将了解encoder–decoder 架构是如何工作的，并构建一个问答生成器。

7. 作曲

本章着眼于音乐生成，这也是一个序列生成问题，但提出了额外的挑战，如建模音乐的音高和节奏。我们将了解许多用于文本生成的技术如何可以应用于音乐生成任务，但我们还将探索一个称为MuseGAN的深度学习架构，它将第4章(关于GAN)中的思想应用于音乐数据。

8. 玩游戏

本章展示了生成模型如何应用于其他机器学习领域，如强化学习。最近几年最激动人心的一篇论文是“世界模型”，作者展示了一个生成模型可以用作智能体训练的环境，因此本质上允许智能体对未来可能的场景“做梦”，想象如果采取某些行动会发生什么，完全在其环境的概念模型中。

9. 生成模型的未来

本章是对当前生成模型的概述，并回顾了在本书中介绍的技术。我们还将放眼未来，探索今天可用的最先进技术如GPT-2和BigGAN可能如何改变我们创造的方式，我们是否能创造一个人造实体，它可以生产内容，创造性地生成艺术作品、文学和音乐。

10. 结论

本章关于为什么生成式深度学习在未来5-10年可能成为机器学习最重要、最有影响力的领域。

总结

在一个事实和虚构不那么容易分离的世界里，至关重要的是有一些工程师能够详细地理解生成模型的工作原理，并且不会因为技术限制而却步。

希望这本书能帮助你了解当前最先进的技术，同时也能让你享受阅读的乐趣。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

GaN

GaN

+关注

关注
19

文章
1916

浏览量
72913
深度学习

深度学习

+关注

关注
73

文章
5489

浏览量
120942

原文标题：O'Reilly新书：《生成式深度学习》，近5年最先进GAN一网打全！

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

【书籍评测活动NO.49】大模型启示录：一本AI应用百科全书

的大模型场景。本书像一本AI应用百科全书，给予读者落地大模型时的启发。本书的作者来自大模型

发表于 10-28 15:34

FPGA加速深度学习模型的案例

FPGA（现场可编程门阵列）加速深度学习模型是当前硬件加速领域的一个热门研究方向。以下是一些FPGA加速

发表于 10-25 09:22 •133次阅读

AI大模型与深度学习的关系

AI大模型与深度学习之间存在着密不可分的关系，它们互为促进，相辅相成。以下是对两者关系的介绍：一、深度

发表于 10-23 15:25 •347次阅读

【《大语言模型应用指南》阅读体验】+ 基础知识学习

一些局限性。例如，模型可能无法完全理解文本中的深层含义和语境信息；同时，由于训练数据可能存在偏差和噪声，生成的答案也可能存在不准确或误导性的情况。总结以下，大语言模型通过

发表于 08-02 11:03

深度学习模型量化方法

深度学习模型量化是一种重要的模型轻量化技术，旨在通过减少网络参数的比特宽度来减小

发表于 07-15 11:01 •450次阅读

深度学习中的模型权重

在深度学习这一充满无限可能性的领域中，模型权重（Weights）作为其核心组成部分，扮演着至关重要的角色。它们不仅是模型

发表于 07-04 11:49 •890次阅读

深度学习模型训练过程详解

深度学习模型训练是一个复杂且关键的过程，它涉及大量的数据、计算资源和精心设计的算法。训练一个深度

发表于 07-01 16:13 •1056次阅读

深度学习的模型优化与调试方法

深度学习模型在训练过程中，往往会遇到各种问题和挑战，如过拟合、欠拟合、梯度消失或爆炸等。因此，对深度学习

发表于 07-01 11:41 •680次阅读

大语言模型：原理与工程实践+初识2

的一系列变革。大语言模型是深度学习的应用之一，可以认为，这些模型的目标是模拟人类交流，为了理解

发表于 05-13 00:09

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》

《大语言模型》是一本深入探讨人工智能领域中语言模型的著作。作者通过对语言模型的基本概念、基础技术、应用场景分析，为读者揭开了这一领域的神秘面

发表于 04-30 15:35

【RTC程序设计：实时音视频权威指南】本书概览

本书内容看一本书的内容从其目录即可看出内容与结构，从本书目录看其内容非常丰富充实。书中第一章介绍了一些计算机的基本知识。然后第二章介绍了视

发表于 04-21 17:09

《Linux常用命令自学手册》工具书永远是常备的秘籍

和帮助。非常适合作为一种你要学习开发的Linux系统的基础工具书使用。《Linux常用命令自学手册》是一本非常值得

发表于 01-29 19:42

《深入理解FFmpeg阅读体验》+ 书收到了，崭新的开篇

。今天取回来后，就迫不及待地粗略看了看书的内容，看了序言和推荐者序，感觉都是大佬级别的。作者也是 FFmepeg 的 maintainer。如此偏向一线技术的书相信是一本好书，期待下一

发表于 01-07 18:57

《Linux常用命令自学手册》+一本手边linux速查字典

，即使不能一时都记住，本书也可以作为办公桌边随时查阅的工具书。我手头有一本也是《linux命令速查手册》，16K的很厚一本，和

发表于 12-26 08:46

如何基于深度学习模型训练实现工件切割点位置预测

Hello大家好，今天给大家分享一下如何基于深度学习模型训练实现工件切割点位置预测，主要是通过对YOLOv8姿态评估模型在自定义的数据集上训

发表于 12-22 11:07 •742次阅读

搜索历史

一本书来帮助你入门深度学习生成模型

评论

【书籍评测活动NO.49】大模型启示录：一本AI应用百科全书

FPGA加速深度学习模型的案例

AI大模型与深度学习的关系

【《大语言模型应用指南》阅读体验】+ 基础知识学习

深度学习模型量化方法

深度学习中的模型权重

深度学习模型训练过程详解

深度学习的模型优化与调试方法

大语言模型：原理与工程实践+初识2

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》

【RTC程序设计：实时音视频权威指南】本书概览

《Linux常用命令自学手册》工具书永远是常备的秘籍

《深入理解FFmpeg阅读体验》+ 书收到了，崭新的开篇

《Linux常用命令自学手册》+一本手边linux速查字典

如何基于深度学习模型训练实现工件切割点位置预测