0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ICLR 2019在官网公布了最佳论文奖!

DPVg_AI_era 来源:lq 2019-05-07 09:00 次阅读

ICLR 2019今天在官网公布了最佳论文奖!两篇最佳论文分别来自Mila/加拿大蒙特利尔大学、微软蒙特利尔研究院和MIT CSAIL,主题分别集中在NLP深度学习模型和神经网络压缩。

今天,ICLR 2019在官网公布了最佳论文奖!

两篇最佳论文分别来自Mila/加拿大蒙特利尔大学、微软蒙特利尔研究院和MITCSAIL,主题分别集中在NLP深度学习模型和神经网络压缩。

ICLR 是深度学习领域的顶级会议,素有深度学习顶会 “无冕之王” 之称。今年的 ICLR 大会从5月6日到5月9日在美国新奥尔良市举行。

今年 ICLR 共接收 1578 篇投稿,相较去年 981 篇有了很大的增加,录用结果如下:1.5% 录用为 oral 论文(24 篇)、30.2% 录用为 poster 论文(476 篇),58% 论文被拒(918 篇)、610% 撤回(160 篇)。

与往年一样,ICLR 2019采用公开评审制度,所有论文会匿名公开在 open review 网站上,接受同行们的匿名评分和提问。

今年论文平均打分是 5.15

关键词排序前 50

接下来,新智元带来两篇最佳论文的解读:

最佳论文1:有序神经元:将树结构集成到循环神经网络

标题:Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks

《有序神经元:将树结构集成到循环神经网络》

作者:Yikang Shen,Shawn Tan,Alessandro Sordoni,Aaron Courville

作者机构:Mila/加拿大蒙特利尔大学、微软蒙特利尔研究院

论文地址:https://openreview.net/forum?id=B1l6qiR5F7

摘要:

自然语言是一种分层结构:较小的单元(例如短语)嵌套在较大的单元(例如子句)中。当较大的成分结束时,嵌套在其中的所有较小单元也必须结束。虽然标准的LSTM架构允许不同的神经元在不同的时间尺度上跟踪信息,但它并没有明确地偏向于对成分层次结构建模。

本文提出通过对神经元进行排序来增加这种归纳偏差;一个主输入和遗忘门的向量确保当一个给定的神经元被更新时,按照顺序跟随它的所有神经元也被更新。所提出的新循环结构称为有序神经元LSTM (ordered neurons LSTM, ON-LSTM),在语言建模、无监督句法分析、目标语法评估和逻辑推理四个不同的任务上都取得了良好的性能。

关键词:深度学习,自然语言处理,递归神经网络,语言建模

一句话概括:本文提出一种新的归纳偏置,将树结构集成到循环神经网络中。

从实用的角度看,将树结构集成到神经网络语言模型中有以下几个重要原因:

深度神经网络的一个关键特征是获得抽象层次不断增加的分层表示;

建模语言的组成效应,并为梯度反向传播提供快捷方式,以帮助解决长期依赖问题;

通过更好的归纳偏置改进泛化,同时能够减少对大量训练数据的需求。

图1:由模型推断的二进制解析树(左)及其对应的round-truth(右)。

问题是:具有对学习这种潜在树结构的归纳偏置的架构能否获得更好的语言模型?

在这篇论文中,我们提出有序神经元(ordered neurons),这是一种面向循环神经网络的新型归纳偏置。这种归纳偏置增强了存储在每个神经元中的信息的生命周期的分化:高级神经元存储长期信息,这些信息通过大量步骤保存,而低级神经元存储短期信息,这些信息可以很快被遗忘。

为了避免高级和低级神经元之间的固定划分,我们提出一种新的激活函数——cumulative softmax,或称为cumax(),用于主动分配神经元来存储长/短期信息。

基于cumax()和LSTM架构,我们设计了一个新的模型ON-LSTM,该模型偏向于执行类似树的组合操作。

ON-LSTM模型在语言建模、无监督成分句法分析、目标句法评估和逻辑推理四项任务上都取得了良好的性能。对无监督成分句法分析的结果表明,所提出的归纳偏置比以前模型更符合人类专家提出的语法原则。实验还表明,在需要捕获长期依赖关系的任务中,ON-LSTM模型的性能优于标准LSTM模型。

有序神经元

图2:一个成分解析树和ON-LSTM的隐藏状态之间的对应关系

ON-LSTM

ON-LSTM模型与标准LSTM的架构类似:

与LSTM的不同之处在于,这里用了一个新函数替换cell state的 update 函数。

实验

语言建模

表1:Penn Treebank语言建模任务验证集和测试集上的单模型困惑度。

如表1所示,ON-LSTM模型在共享相同的层数、嵌入维数和隐藏状态单元的情况下,比标准的LSTM性能更好。值得注意的是,我们可以在不添加skip connection或显著增加参数数量的情况下提高LSTM模型的性能。

无监督成分句法分析(ConstituencyParsing)

表2:在full WSJ10和WSJ test两个数据集上评估的成分句法分析结果

目标句法评估

表3:ON-LSTM和LSTM在每个测试用例中的总体精度

表3显示,ON-LSTM在长期依赖情况下表现更好,而基线LSTM在短期依赖情况下表现更好。不过,ON-LSTM在验证集上实现了更好的困惑度。

逻辑推理

图3:模型的测试准确性,在逻辑数据的短序列(≤6)上训练。

图3显示了ON-LSTM和标准LSTM在逻辑推理任务上的性能。

最佳论文2:彩票假设

标题:The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks

《彩票假设:寻找稀疏的、可训练的神经网络》

作者:Jonathan Frankle,Michael Carbin

作者机构:MIT CSAIL

论文地址:https://openreview.net/forum?id=rJl-b3RcF7

摘要:

神经网络剪枝技术可以在不影响精度的前提下,将训练网络的参数数量减少90%以上,降低存储需求并提高推理的计算性能。然而,当前的经验是,剪枝产生的稀疏架构从一开始就很难训练,这同样可以提高训练性能。

我们发现,一种标准的剪枝技术可以自然地揭示子网络,这些子网络的初始化使它们能够有效地进行训练。基于这些结果,我们提出了“彩票假设”(lottery ticket hypothesis):包含子网络(“中奖彩票”,winning tickets)的密集、随机初始化的前馈网络,这些子网络在单独训练时,经过类似次数的迭代达到与原始网络相当的测试精度。我们找到的“中奖彩票”中了初始化彩票:它们的连接具有初始权重,这使得训练特别有效。

我们提出一个算法来确定中奖彩票,并激进型了一系列实验来支持彩票假说以及这些偶然初始化的重要性。我们发现,MNIST和CIFAR10的中奖彩票的规模始终比几个全连接架构和卷积前馈架构小10-20%。超过这个规模的话,我们发现中奖彩票比原来的网络学习速度更快,达到了更高的测试精度。

关键词:神经网络,稀疏性,剪枝,压缩,性能,架构搜索

一句话概括:可以在训练后剪枝权重的前馈神经网络,也可以在训练前剪枝相同的权重。

本文证明了,始终存在较小的子网络,它们从一开始就进行训练,学习速度至少与较大的子网络一样快,同时能达到类似的测试精度。

图1:早期停止发生的迭代(左边)和用于MNIST的Lenet架构以及用于CIFAR10的conv2、conv4和conv6架构的迭代(右边)的测试精度。虚线是随机抽样的稀疏网络。实线是中奖彩票。

图1中的实线显示了我们找到的网络,即winning tickets。

论文提出了几个新概念,首先是“彩票假设”(The Lottery Ticket Hypothesis)。

彩票假设:将一个复杂网络的所有参数当作一个奖池,奖池中存在一组子参数所对应的子网络(代表中奖号码,文中的wining ticket),单独训练该子网络,可以达到原始网络的测试精度。

那么怎样找到中奖彩票呢?

确定中奖彩票:通过训练一个网络并修剪它的最小量级权重来确定中奖彩票。其余未修剪的连接构成了中奖彩票的架构。

具体来说,有以下4步:

随机初始化一个复杂神经网络

训练复杂网络j次,得到网络参数

对模型按p%进行修剪,得到一个mask m;将

对留下来的模型,重新用

图2:本文测试的架构

本文的贡献

我们证明剪枝可以揭示可训练的子网络,这些子网络达到了与原始网络相当的测试精度;

我们证明剪枝发现的中奖彩票比原始网络学习更快,同时具有更高的测试精度和更好的泛化能力。

我们提出“彩票假设”,作为神经网络组成的新视角,可以解释这些发现。

应用

本文对彩票假设进行了实证研究。既然我们已经证明了中奖彩票的存在,我们希望利用这一知识:

提高训练性能。由于中奖彩票可以从一开始就单独进行训练,我们希望能够设计出能够搜索中奖彩票并尽早进行修剪的训练方案。

设计更好的网络。中奖彩票揭示了稀疏架构和特别擅长学习的初始化的组合。我们可以从中获得灵感,设计有助于学习的新架构和初始化方案。我们甚至可以把为一项任务发现的中奖彩票迁移到更多其他任务。

提高对神经网络的理论理解。我们可以研究为什么随机初始化的前馈网络似乎包含中奖彩票,以及增加对优化和泛化的理论理解。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4732

    浏览量

    100372
  • 论文
    +关注

    关注

    1

    文章

    103

    浏览量

    14941
  • 深度学习
    +关注

    关注

    73

    文章

    5456

    浏览量

    120850

原文标题:ICLR 2019最佳论文揭晓!NLP深度学习、神经网络压缩成焦点

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    摩尔斯微电子荣获2024年WBA行业大奖最佳Wi-Fi创新等多项殊荣

    ,巩固Wi-Fi行业的领军地位。除荣获Wi-Fi Now的“最佳Wi-Fi物联网产品”,并被Fast Company誉为“未来科技之星”(Next Big Things)外,摩尔
    发表于 11-01 14:41

    华锐捷荣获第六届金辑最佳技术实践应用

    近日,2024第十二届汽车与环境创新论坛暨第六届金辑中国汽车新供应链百强颁奖盛典在上海圆满落幕。在这场汽车行业的盛会上,浙江华锐捷技术有限公司凭借其Hi-Pilot前视辅助驾驶一体机,荣获2024第六届金辑
    的头像 发表于 10-30 16:52 194次阅读

    安富利荣获第六届金辑最佳技术实践应用

    最佳技术实践应用”。这一殊荣不仅彰显安富利汽车电子领域中深厚积淀,更是对其技术实力和创新能力有力证明。
    的头像 发表于 10-30 15:48 139次阅读

    类比半导体荣获第六届金辑最佳技术实践应用

    近日,由盖世汽车主办的第六届“金辑”颁奖典礼圆满落幕,类比半导体凭借卓越的产品与创新的技术,荣获盖世汽车2024第六届金辑·中国汽车新供应链百强评选“最佳技术实践应用”。这一荣誉
    的头像 发表于 10-30 11:50 206次阅读

    赛卓电子荣获2024金辑——最佳技术实践应用

    赛卓电子本次“金辑”评选过程中,凭借新品SC9685/86TS两款变速箱传感器芯片荣获“金辑”2024中国汽车新供应链百强——最佳技术实践应用
    的头像 发表于 10-28 14:57 200次阅读
    赛卓电子荣获2024金辑<b class='flag-5'>奖</b>——<b class='flag-5'>最佳</b>技术实践应用<b class='flag-5'>奖</b>

    爱芯元速荣膺最佳技术实践应用

    爱芯元智车载事业部(品牌“爱芯元速”)凭借在车载芯片领域的创新技术研发实力以及推动量产上车方面的卓越成绩收获本届“金辑”的“2024最佳技术实践应用”。
    的头像 发表于 10-25 11:39 225次阅读

    安波福苏州荣获“2024大苏州最佳雇主”及“2024最佳HR团队

    日前,“2024第十一届大苏州最佳雇主”颁奖盛典隆重举行。安波福电子(苏州)有限公司获颁“2024大苏州最佳雇主”及“2024最佳HR团队”。
    的头像 发表于 10-14 09:54 319次阅读

    2024年上海海思MCU开发者体验招募,手机/MatePad大奖等你拿!

    名。 2)优秀MCU开发者体验:按评选标总分第4-10名。 3)MCU开发者体验贡献:按评选标准总分大于60分,不含前10名。 4)最具商业价值
    发表于 08-02 17:29

    中科驭数联合处理器芯片全国重点实验室获得“CCF芯片大会最佳论文

    Accelerator on FPGA with Graph Reordering Engine》获得“CCF芯片大会最佳论文”。该项工作由鄢贵海研究员指导完成,论文第一作者是博士
    的头像 发表于 08-02 11:09 531次阅读

    南芯科技荣获OPPO 2024 年度“最佳交付”和“优秀质量

      近日,南芯科技(证券代码:688484)凭借稳定的产品交付和过硬的产品质量,同时荣获OPPO 2024 年度“最佳交付”和“优秀质量”。这两个奖项旨在表彰 OPPO 长期优秀的合作伙伴
    的头像 发表于 07-13 17:41 1560次阅读

    千视荣获2023年度DAV数字音视工程年度最佳解决方案

    近期,千视电子获得“DAV数字音视工程”颁发的《年度最佳解决方案》,以表彰千视解决方案AVoverIP领域做出的一系列杰出贡献。作为数字音视频领域的权威媒体和评选平台,DAV数字
    的头像 发表于 02-19 12:24 327次阅读
    千视荣获2023年度DAV数字音视工程<b class='flag-5'>网</b>年度<b class='flag-5'>最佳</b>解决方案<b class='flag-5'>奖</b>!

    沙特stc和华为商用核心自动化实践荣获“年度最佳自动化项目

    近期,Global Telecom Awards(GTA)颁奖典礼英国伦敦举行。沙特stc和华为因在核心自动化方面的创新实践荣获“年度最佳自动化项目”(Automation
    的头像 发表于 01-17 10:15 399次阅读

    ICLR 2024高分投稿:用于一般时间序列分析的现代纯卷积结构

    这篇是 ICLR 上用 TCN 来做一般的时间序列分析的论文 Rebuttal 之后的分数为 888,算得上是时间序列领域相关的论文中最高分那一档
    的头像 发表于 12-18 16:05 792次阅读
    <b class='flag-5'>ICLR</b> 2024高分投稿:用于一般时间序列分析的现代纯卷积结构

    金浦智能荣获&quot;年度中国最佳投资机构&quot;及&quot;年度最佳行业投资机构&quot;

    金浦智能是金浦产业投资基金管理有限公司旗下专注于智能制造领域高科技企业股权投资的专业团队。在此前的历届IC风云榜评比中,金浦智能已连续三次荣膺最高殊荣——“年度中国最佳投资机构”,而公司总裁田华峰也曾多次荣获 “年度最佳投资人
    的头像 发表于 12-18 10:47 681次阅读

    富昌电子荣获 “2023最佳全球分销商”

    富昌电子 Diodes 公司 2023 年全球分销大会上荣获 “最佳全球分销商”
    的头像 发表于 11-27 16:41 496次阅读