首页
技术

可编程逻辑

MEMS/传感技术

嵌入式技术

模拟技术

控制/MCU

处理器/DSP

存储技术

EMC/EMI设计

电源/新能源

测量仪表

制造/封装

RF/无线

接口/总线/驱动

EDA/IC设计

光电显示

连接器

PCB设计

LEDs

汽车电子

医疗电子

人工智能

可穿戴设备

军用/航空电子

工业控制

触控感测

智能电网

音视频及家电

通信网络

机器人

vr|ar|虚拟现实

安全设备/系统

移动通信

便携设备

物联网

区块链

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充电桩

氮化镓

BLDC

逆变器

5G

电机控制
资源

技术文库

新品速递

电路图

元器件知识

电子百科

最新技术文章

元器件搜索引擎
下载

在线工具

常用软件

电子书

datasheet
专栏

电子说

专栏
社区

论坛

问答

小组

技术专栏

社区之星

试用中心

HarmonyOS技术社区

2023电子工程师大会
研究院
活动

设计大赛

硬创大赛

社区活动

线下会议

在线研讨会

小测验
学院

直播

课程
视频
企业号
工具

datasheet查询

免费评测试用

技术子站

搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

深入浅出的介绍了深度学习的理论——用理论的力量横扫深度学习！

目前深度学习的应用较为广泛，尤其是各种开源库的使用，导致很多从业人员只注重应用的开发，却往往忽略了对理论的深究与理解。普林斯顿大学教授Sanjeev Arora近期公开的77页PPT，言简意赅、深入浅出的介绍了深度学习的理论——用理论的力量横扫深度学习！（文末附PPT下载地址）

深度学习历史

学习任何一门知识都应该先从其历史开始，把握了历史，也就抓住了现在与未来。——BryanLJ

由图可以简单看出深度学习的发展历史，在经历了单调、不足与完善后，发展到了如今“动辄DL”的态势。

定义与基本概念

神经网络基本结构图：

定义：

θ：深度网络的参数

训练集：(x1, y1)，(x2, y2)，…，(xn, yn)

损失函数ζ(θ,x,y)：表示网络的输出与点x对应的y的匹配度

目标： argminθEi[ζ(θ,x1, y1)]

梯度下降：

结合GPUs、大型数据集，优化概念已经塑造了深度学习：

反向传播：用线性时间算法来计算梯度；

随机梯度下降：通过训练集的小样本评估

梯度、解空间推动形成了残差网络（resnet）、WaveNet及Batch-Normalization等；

理论的目标：通过整理定理，得出新的见解和概念。

深度学习中的优化

困难：深度学习中大多数优化问题是非凸（non-convex）的，最坏的情况是NP难问题（NP-hard）。

维数灾难：指在涉及到向量的计算的问题中，随着维数的增加，计算量呈指数倍增长的一种现象

深度学习“黑盒”分析：

原因：

1、无法确定解空间；

2、没有明确的(xi, yi)数学描述；

所以，求全局最优解是不可行的。

未知解空间中的控制梯度下降：

≠0→∃下降方向，但如果二阶导数比较高，允许波动很大。为了确保下降，采用由平滑程度（可由高斯平滑 f来定义）决定的小步骤。

平滑：

要求：满足且与成正比。

非“黑盒”分析：

很多机器学习问题是深度为2的子案例，例如，输入层和输出层之间的一个隐含层。通常假设网络的结构、数据分布，等等。比起GD/SGD，可以使用不同算法，例如张量分解、最小化交替以及凸优化等等。

过度参数化(over-parametrization)和泛化(generalization)理论

教科书中说：大型模型会导致过拟合

很多人认为：SGD +正则化消除了网络的“过剩容量”(excess capacity)，但是过剩容量依旧还是存在的，如下图所示：

事实上，在线性模型中也存在同样的问题。

泛化理论：

测试损失(Test Loss)-训练损失(Training Loss)≤

其中，N是“有效能力”。

“真实容量”（true capacity）的非空估计被证明是难以捉摸的：

“真实参数”(true parameters)的非空边界被证明是难以捉摸的：

深度网络噪声稳定性(可以视作深度网络的边缘概念):

噪声注入：为一个层的输出x添加高斯η。

测量更高层次的变化，若变化是小的，那么网络就是噪声稳定的。

VGG19的噪声稳定性：

当高斯粒子经过更高层时的衰减过程

与泛化相关定性实验：

垫层（layer cushion）在正常数据上的训练要比在损坏数据上的训练高得多

在正常数据训练过程中的进化

“深度”的作用

深度的作用是什么？

理想的结果是：当遇到自然学习问题时，不能用深度d来完成，但可以用深度d+1来完成。但是目前，由于理论依据不足，缺乏“自然”学习问题的数学形式化，还无法达到理想的结果。

深度的增加对深度学习是有益还是有害的？

支持：会出现更好的表现(正如上面实验结果所示)；

反对：使优化更加困难(梯度消失(vanishing gradient)、梯度爆炸(exploding gradient)，除非像残差网络这样的特殊架构)。

生成模型与生成对抗网络(GAN)理论

无监督学习：“流行假设”(Mainfold Assumption)：

学习概率密度p(X|Z)的典型模型

其中，X是图像，Z是流行上的编码。目的是使用大量未标签的数据集来学习图像→编码匹配(code mapping)。

深度生成模型（deep generative model）

隐含假设： Dreal是由合理大小的深度网络生成的。

生成对抗网络（GANs）

动机：

(1)标准对数似然函数值(log-likelihood)目标倾向于输出模糊图像。

(2)利用深度学习的力量(即鉴别器网络,discriminator net)来改进生成模型，而不是对数似然函数。

u：生成网络可训练参数

v：鉴别器网络可训练参数

鉴别器在训练后，真实输入为1，合成输入为0。

生成器训练来产生合成输出，使得鉴别器输出值较高。

GANs噩梦：模式崩溃(mode collapse)

因为鉴别器只能从少数样本中学习，所以它可能无法教会生成器产生足够大的多样性分布。

评估来自著名GANs的支持大小(support size)

CelaA：200k训练图像

DC-GAN：重复500个样本，500x500 =250K

BiGAN和所有支持大小,1000x1000 =1M

(结果与CIFAR10相似)

深度学习—自由文本嵌入

无监督学习文字嵌入经典流程

常用方法：复发性神经网络或LSTM等

手工业(cottage industry)的文本嵌入是线性的：

最简单的：构成词(constituent word)的词嵌入求和

加权求和：通过适应段落数据集来学习权重

性能（相似性、蕴涵任务）：

较先进的句子嵌入方法与下游分类(downstream classification)任务的比较：

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4845

浏览量
108343
机器学习

机器学习

+关注

关注
67

文章
8570

浏览量
137392
深度学习

深度学习

+关注

关注
73

文章
5614

浏览量
124729

原文标题：普林斯顿大学教授：用理论的力量横扫深度学习（77PPT）

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

评论

电子发烧友

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

电子发烧友

关于我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

张迎辉：mikezhang@elecfans.com

关注我们的微信

下载发烧友APP

机器人发烧友

版权所有 © 长沙勒克斯教育咨询有限公司

湖南省长沙市开福区月湖街道匍园路20号聚恒科技园1栋2301-1房
电子发烧友 （电路图） 电信与信息服务业务经营许可证：湘B2-20260003 湘ICP备2023036445号-105-1