Google AI的研究人员的最新研究提出一个全新概念：刚度(Stiffness)-电子发烧友网

Google AI的研究人员的最新研究提出一个全新概念：刚度(Stiffness)，为探索神经网络的训练和泛化问题提供了一个新视角。

Google AI的研究人员最近在arxiv发表的一篇新论文，探索了神经网络的训练和泛化问题的一个新视角。

论文题为“Stiffness: A New Perspective on Generalization in Neural Networks”，作者是谷歌 AI 苏黎世研究中心的Stanislav Fort等人。

论文提出“刚度”(stiffness)这个概念，透过这个概念研究了神经网络的训练和泛化问题。

研究人员通过分析一个示例中的小梯度步骤如何影响另一个示例的损失来测量网络的“刚度”。

具体来说，他们在4个分类数据集(MNIST、FASHION MNIST、CIFAR-10、CIFAR-100)上分析了全连接卷积神经网络的刚度。他们关注的是刚度如何随着1) 类隶属度(class membership），2)数据点之间的距离，3)训练迭代，和4)学习率而变化。

研究表明，当在固定的验证集上计算时，刚度与泛化(generalization)直接相关。刚度函数的灵活性较差，因此不太容易对数据集的特定细节进行过拟合。

结果表明，“刚度”的概念有助于诊断和表征泛化。

学习率的选择对学习函数的刚度特性有显著影响。高学习率会导致函数逼近在更大的距离上“更刚”(stiffer)，并且学习到的特征可以更好地泛化到来自不同类的输入。另一方面，较低的学习率似乎能学到更详细、更具体的特征，即使在训练集上导致同样的损失，也不能泛化到其他类。

这表明，高学习率的优势不仅在于收敛所需的步骤更少，还在于它们倾向于学习的特性具有更高的泛化性，即高学习率充当了有效的正则化器。

刚度(Stiffness)的定义

刚度的定义如下：

如果点处的损失相对于网络权重的梯度是，并且点处的梯度是，则我们定义“刚度”为。

图1：“刚度”概念的图示

如图1所示，“刚度”可以看做是通过应用基于另一个输入的梯度更新引起的输入损失的变化，相当于两个输入的梯度之间的梯度对齐(gradient alignment)。

实验和结果

基于类隶属度关系的刚度特性

我们基于验证集数据点的类隶属度(class membership )作为训练迭代函数，研究了验证集数据点的刚度特性。

对于带有真实标签的MNIST、FASHION MNIST和CIFAR-10数据集，结果分别显示为图3、图5、图6，对于带有随机排列训练集标签的MNIST数据集，结果为图4.

图3：MNIST上完全连接网络刚度的Class-membership dependence

图4：MNIST上完全连接网络刚度的Class-membership dependence，训练时使用随机排列的标签。

图5：FASHION MNIST上完全连接网络刚度的Class-membership dependence

图6：CIFAR-10上卷积神经网络刚度的Class-membership dependence

图3、图5和图6都显示了4个训练阶段的刚度矩阵：初始化阶段(任何梯度步骤之前)、优化早期阶段和两个后期阶段。

学习率对刚度的影响

图8：在MNIST 和 FASHION MNIST上以不同学习率训练，不同类别的刚度。

如图8所示，这两幅图给出了三种不同训练损失的 class dependent刚度矩阵。较高的学习率导致来自不同类的输入之间的刚度更高，表明它们学习的特性在不同类之间更加可泛化(generalizable)。

结论

我们探讨了神经网络刚度的概念，并用它来诊断和表征泛化。我们研究了在真实数据集上训练的模型的刚度，并测量了其随训练迭代、类隶属度、数据点之间的距离和学习率的选择而变化的情况。为了探讨泛化和过拟合，我们重点研究了验证集中数据点的刚度。

总结而言，本文定义了刚度的概念，证明了它的实用性，为更好地理解神经网络中的泛化特性提供了一个新的视角，并观察了其随学习率的变化。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Google

Google

+关注

关注
5

文章
1767

浏览量
57647
神经网络

神经网络

+关注

关注
42

文章
4776

浏览量
100934
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24746

原文标题：你的模型刚不刚？谷歌提出“刚度”概念，探索神经网络泛化新视角

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

搜索历史

Google AI的研究人员的最新研究提出一个全新概念：刚度(Stiffness)

评论

东京大学的研究人员：新开发的电子皮肤有一个LED显示屏

Google研究人员开发增强现实显微镜检测癌细胞

带你了解AI研究人员年薪百万背后的真相

深度学习全新打开方式Google Brain提出概念激活向量新方法

研究人员们提出了一系列新的点云处理模块

Facebook的研究人员提出了Mesh R-CNN模型

Google AI发布一项新研究可以“近乎即时”地预报天气

研究人员已经使用机器学习来开发血液测试

AI研究人员如何应对透明AI

研究人员发现一个可窃取AWS凭证的加密货币蠕虫

研究人员宣布了一种新的AI机器学习工具

美研究人员发明全新AI感应设备

研究人员为锂硫电池提出一种新阴极设计概念

研究人员制造出一种复制人类的行为下棋的AI

小到一个分子！研究人员开发一种微小的压电电阻器