0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深入浅出的介绍了深度学习的理论——用理论的力量横扫深度学习!

DPVg_AI_era 来源:未知 作者:李倩 2018-07-12 09:25 次阅读

目前深度学习的应用较为广泛,尤其是各种开源库的使用,导致很多从业人员只注重应用的开发,却往往忽略了对理论的深究与理解。普林斯顿大学教授Sanjeev Arora近期公开的77页PPT,言简意赅、深入浅出的介绍了深度学习的理论——用理论的力量横扫深度学习!(文末附PPT下载地址)

深度学习历史

学习任何一门知识都应该先从其历史开始,把握了历史,也就抓住了现在与未来。——BryanLJ

由图可以简单看出深度学习的发展历史,在经历了单调、不足与完善后,发展到了如今“动辄DL”的态势。

定义与基本概念

神经网络基本结构图:

定义:

θ:深度网络参数

训练集:(x1, y1),(x2, y2),…,(xn, yn)

损失函数ζ(θ,x,y):表示网络的输出与点x对应的y的匹配度

目标: argminθEi[ζ(θ,x1, y1)]

梯度下降:

结合GPUs、大型数据集,优化概念已经塑造了深度学习:

反向传播:用线性时间算法来计算梯度;

随机梯度下降:通过训练集的小样本评估

梯度、解空间推动形成了残差网络(resnet)、WaveNet及Batch-Normalization等;

理论的目标:通过整理定理,得出新的见解和概念。

深度学习中的优化

困难:深度学习中大多数优化问题是非凸(non-convex)的,最坏的情况是NP难问题(NP-hard)。

维数灾难:指在涉及到向量的计算的问题中,随着维数的增加,计算量呈指数倍增长的一种现象

深度学习“黑盒”分析:

原因:

1、无法确定解空间;

2、没有明确的(xi, yi)数学描述;

所以,求全局最优解是不可行的。

未知解空间中的控制梯度下降:

 ≠0→∃下降方向,但如果二阶导数比较高,允许波动很大。为了确保下降,采用由平滑程度(可由高斯平滑 f来定义)决定的小步骤。

平滑:

要求:满足且与成正比。

非“黑盒”分析:

很多机器学习问题是深度为2的子案例,例如,输入层和输出层之间的一个隐含层。通常假设网络的结构、数据分布,等等。比起GD/SGD,可以使用不同算法,例如张量分解、最小化交替以及凸优化等等。

过度参数化(over-parametrization)和泛化(generalization)理论

教科书中说:大型模型会导致过拟合

很多人认为:SGD +正则化消除了网络的“过剩容量”(excess capacity),但是过剩容量依旧还是存在的,如下图所示:

事实上,在线性模型中也存在同样的问题。

泛化理论:

测试损失(Test Loss)-训练损失(Training Loss)≤

其中,N是“有效能力”。

“真实容量”(true capacity)的非空估计被证明是难以捉摸的:

“真实参数”(true parameters)的非空边界被证明是难以捉摸的:

深度网络噪声稳定性(可以视作深度网络的边缘概念):

噪声注入:为一个层的输出x添加高斯η。

测量更高层次的变化,若变化是小的,那么网络就是噪声稳定的。

VGG19的噪声稳定性:

当高斯粒子经过更高层时的衰减过程

与泛化相关定性实验:

垫层(layer cushion)在正常数据上的训练要比在损坏数据上的训练高得多

在正常数据训练过程中的进化

“深度”的作用

深度的作用是什么?

理想的结果是:当遇到自然学习问题时,不能用深度d来完成,但可以用深度d+1来完成。但是目前,由于理论依据不足,缺乏“自然”学习问题的数学形式化,还无法达到理想的结果。

深度的增加对深度学习是有益还是有害的?

支持:会出现更好的表现(正如上面实验结果所示);

反对:使优化更加困难(梯度消失(vanishing gradient)、梯度爆炸(exploding gradient),除非像残差网络这样的特殊架构)。

生成模型与生成对抗网络(GAN)理论

无监督学习:“流行假设”(Mainfold Assumption):

学习概率密度p(X|Z)的典型模型

其中,X是图像,Z是流行上的编码。目的是使用大量未标签的数据集来学习图像→编码匹配(code mapping)。

深度生成模型(deep generative model)

隐含假设: Dreal是由合理大小的深度网络生成的。

生成对抗网络(GANs)

动机:

(1)标准对数似然函数值(log-likelihood)目标倾向于输出模糊图像。

(2)利用深度学习的力量(即鉴别器网络,discriminator net)来改进生成模型,而不是对数似然函数。

u:生成网络可训练参数

v:鉴别器网络可训练参数

鉴别器在训练后,真实输入为1,合成输入为0。

生成器训练来产生合成输出,使得鉴别器输出值较高。

GANs噩梦:模式崩溃(mode collapse)

因为鉴别器只能从少数样本中学习,所以它可能无法教会生成器产生足够大的多样性分布。

评估来自著名GANs的支持大小(support size)

CelaA:200k训练图像

DC-GAN:重复500个样本,500x500 =250K

BiGAN和所有支持大小,1000x1000 =1M

(结果与CIFAR10相似)

深度学习—自由文本嵌入

无监督学习文字嵌入经典流程

常用方法:复发性神经网络或LSTM等

手工业(cottage industry)的文本嵌入是线性的:

最简单的:构成词(constituent word)的词嵌入求和

加权求和:通过适应段落数据集来学习权重

性能(相似性、蕴涵任务):

较先进的句子嵌入方法与下游分类(downstream classification)任务的比较:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4762

    浏览量

    100521
  • 机器学习
    +关注

    关注

    66

    文章

    8373

    浏览量

    132395
  • 深度学习
    +关注

    关注

    73

    文章

    5491

    浏览量

    120958

原文标题:普林斯顿大学教授:用理论的力量横扫深度学习(77PPT)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    单片机学习资料。深入浅出通俗易懂,用钱买的。

    单片机学习资料。深入浅出通俗易懂,用钱买的。
    发表于 02-04 22:46

    ARM7 深入浅出学习

    深入浅出ARM7 LPC213x_214 学习
    发表于 12-04 17:28

    深入浅出排序学习使用指南

    深入浅出排序学习:写给程序员的算法系统开发实践
    发表于 09-16 11:38

    深度学习入门之基于python的理论与实现

    深度学习入门-基于python的理论与实现(2)
    发表于 06-19 11:22

    深入浅出Cortex-M0学习资料

    深入浅出Cortex-M0学习资料
    发表于 06-18 10:50 0次下载
    <b class='flag-5'>深入浅出</b>Cortex-M0<b class='flag-5'>学习</b>资料

    [CPLD-FPGA]《深入浅出玩转FPGA视频学习课程》35讲全[wmv]

    [CPLD-FPGA]《深入浅出玩转FPGA视频学习课程》35讲全[wmv] 附件比较大所以整理了视频迅雷种子。
    发表于 09-04 14:51 519次下载

    STM32深入浅出之新手篇

    STM32深入浅出之新手篇,很好的单片机学习资料。
    发表于 03-21 17:43 128次下载

    如何理解深度学习深度学习理论探索分析

    普林斯顿大学计算机科学系教授Sanjeev Arora做了深度学习理论理解探索的报告,包括三个部分:
    的头像 发表于 10-03 12:41 3656次阅读

    深度学习入门基于python的理论与实现PDF电子书免费下载

    本书是深度学习真正意义上的入门书,深入浅出地剖析深度学习的原理和相关技术。书中使用Python
    发表于 12-09 08:00 18次下载
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>入门基于python的<b class='flag-5'>理论</b>与实现PDF电子书免费下载

    基于Python的理论与实现进行深度学习的入门教程

    本书是深度学习真正意义上的入门书,深入浅出地剖析深度学习的原理和相关技术。书中使用Python
    发表于 11-11 08:00 6次下载

    深度学习入门基于Python的理论与实现的PDF电子书免费下载

    本书是深度学习真正意义上的入门书,深入浅出地剖析深度学习的原理和相关技术。书中使用Python
    发表于 01-27 08:00 0次下载
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>入门基于Python的<b class='flag-5'>理论</b>与实现的PDF电子书免费下载

    深入浅出学习250个通信原理资源下载

    深入浅出学习250个通信原理资源下载
    发表于 04-12 09:16 28次下载

    深入浅出学习低功耗蓝牙协议栈

    深入浅出学习低功耗蓝牙协议栈
    发表于 06-23 10:35 57次下载

    深入浅出学习eTs(七)如何判断密码是否正确

    本项目Gitee仓地址: 深入浅出eTs学习: 带大家深入浅出学习eTs (gitee.com) 一、基本界面 本项目基于#深入浅出
    的头像 发表于 05-13 13:20 877次阅读
    <b class='flag-5'>深入浅出</b><b class='flag-5'>学习</b>eTs(七)如何判断密码是否正确

    OpenCV库在图像处理和深度学习中的应用

    本文深入浅出地探讨了OpenCV库在图像处理和深度学习中的应用。从基本概念和操作,到复杂的图像变换和深度学习模型的使用,文章以详尽的代码和解
    的头像 发表于 08-18 11:33 843次阅读