0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Hinton的那篇Capsule论文终于揭下了神秘的面纱

深度学习自然语言处理 来源:算法与数学之美 作者:算法与数学之美 2020-11-24 09:56 次阅读

近日,Hinton的那篇Capsule论文终于揭下了神秘的面纱,也因为该篇论文,他被刊进了各大媒体的头版头条。

在论文中,Capsule被Hinton大神定义为这样一组神经元:其活动向量所表示的是特定实体类型的实例化参数

他的实验表明,鉴别式训练的多层Capsule系统,在MNIST手写数据集上表现出目前最先进的性能,并且在识别高度重叠数字的效果要远好于CNN。

该论文无疑将是今年12月初NIPS大会的重头戏。

不过,对于这篇论文的预热,Hinton大神可是早有准备。

一个月前,在多伦多接受媒体采访时,Hinton大神断然宣称要放弃反向传播,让整个人工智能从头再造。不明就里的媒体们顿时蒙圈不少。

8月份的时候,Hinton大神还用一场“卷积神经网络都有哪些问题?”的演讲来介绍他手中的Capsule研究,他认为“CNN的特征提取层与次抽样层交叉存取,将相同类型的相邻特征检测器的输出汇集到一起”是大有问题的。

当时的演讲中,Hinton大神可没少提CNN之父Yann LeCun的不同观点。毕竟,当前的CNN一味追求识别率,对于图像内容的“理解”帮助有限。

而要进一步推进人工智能,让它能像人脑一样理解图像内容、构建抽象逻辑,仅仅是认出像素的排序肯定是不够的,必须要找到方法来对其中的内容进行良好的表示……这就意味着新的方法和技术。

而当前的深度学习理论,自从Hinton大神在2007年(先以受限玻尔兹曼机进行训练、再用有监督的反向传播算法进行调优)确立起来后,除了神经网络结构上的小修小改,很多进展都集中在梯度流上。

正如知乎大V“SIY.Z”在《浅析Hinton最近提出的Capsule计划》时所举的例子。 (https://zhuanlan.zhihu.com/p/29435406)

sigmoid会饱和,造成梯度消失。于是有了ReLU。

ReLU负半轴是死区,造成梯度变0。于是有了LeakyReLU,PReLU。

强调梯度和权值分布的稳定性,由此有了ELU,以及较新的SELU。

太深了,梯度传不下去,于是有了highway。

干脆连highway的参数都不要,直接变残差,于是有了ResNet。

强行稳定参数的均值和方差,于是有了BatchNorm。

在梯度流中增加噪声,于是有了 Dropout。

RNN梯度不稳定,于是加几个通路和门控,于是有了LSTM。

LSTM简化一下,有了GRU。

GAN的JS散度有问题,会导致梯度消失或无效,于是有了WGAN。

WGAN对梯度的clip有问题,于是有了WGAN-GP。

而本质上的变革,特别是针对当前CNN所无力解决的动态视觉内容、三维视觉等难题……进行更为基础的研究,或许真有可能另辟蹊径。

这当然是苦力活,Hinton大神亲自操刀的话,成功了会毁掉自己赖以成名的反向传播算法和深度学习理论,失败了则将重蹈爱因斯坦晚年“宇宙常数”的覆辙。

所以,李飞飞对他在这里的勇气大为赞赏:

如今Capsule的论文刚刚出来,深度学习的各路大神并没有贸然对其下评论,深夜中的外媒亦尚未就此发稿,甚至就连技术圈内一向口水不断的Hacker News,今天也是静悄悄地一片。

不过,可以肯定的一点是,一个月后的NIPS大会,Capsule更进一步的效果必定会有所显现。

至于Hinton此举对于深度学习和整个人工智能界的后续影响,包括Yann LeCun在内的各路大神恐怕都不敢冒下结论,咱们还是静等时间来验证Hinton大神的苦心孤诣到底值不值得吧。

这正如Hinton大神在接受吴恩达采访时所说的:

如果你的直觉很准,那你就应该坚持,最终必能有所成就;反过来你直觉不好,那坚不坚持也就无所谓了。反正你从直觉里也找不到坚持它们的理由。

当然,营长肯定是相信Hinton大神的直觉的,更是期待人工智能能在当前的水平上更进一步。

尽管意义不同,Hinton大神此举却让营长想到了同在古稀之年的开尔文勋爵,他1900年那场关于物理学“两朵乌云”的演讲可是“预言”得贼准:

“紫外灾难”让年近不惑的普朗克为量子力学开创了先河,“以太漂移”让刚刚毕业的爱因斯坦开始思考狭义相对论,经典物理学的大厦就此崩塌。

那么,人工智能上空所飘荡的到底是一朵“乌云”呢?还是一个新的时代?让我们拭目以待。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4773

    浏览量

    100877
  • 神经元
    +关注

    关注

    1

    文章

    363

    浏览量

    18468
  • cnn
    cnn
    +关注

    关注

    3

    文章

    352

    浏览量

    22242

原文标题:70岁Hinton还在努力推翻自己积累了30年的学术成果,他让我知道了什么叫做生命力

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    揭开触控技术的神秘面纱

    点点点、滑滑滑!每天我们这些低头族都在机械的刷屏微信,看来触摸真的改变了人类的生活方式。然而你就不好奇为什么你在玻璃板上动动手指头,机器就知道你要做什么吗?好吧,我来为你揭秘触控技术。 从手机功能的进化开始,IT产品进入了智能化时代。芯片、屏幕、摄像头等都成为了推动IT产品智能化进程的主力。但是很多人都没有注意到,触控技术的不断更新,是我们手中产品可以不断变轻、变薄以及变得更加智能的主因。 人机交互最早通过
    的头像 发表于 11-29 09:45 489次阅读
    揭开触控技术的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>

    解读版|Air780E软件中C语言内存数组的神秘面纱

    今天我们来揭开Air780E 软件中 C 语言内存数组的神秘面纱,希望有所收获。
    的头像 发表于 11-17 10:00 274次阅读
    解读版|Air780E软件中C语言内存数组的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>!

    12条PCB设计规则

    在电子设计的广袤领域中,电磁兼容性(EMC)就如同一位神秘而又严格的考官,时刻检验着 PCB 设计的优劣。今天,我们就来揭开那神秘面纱,一同探索 12 条能助你减少 EMC 的 PCB 设计规则,为你的电子设计之旅点亮明灯。
    的头像 发表于 10-18 13:47 3221次阅读
    12条PCB设计规则

    艾毕胜电子全自动跟拍智能云台驱动板方案的神秘面纱

    在科技飞速发展的今天,全自动跟拍智能云台已经成为摄影、直播等领域的热门设备。而在其背后,驱动板方案则是实现其出色性能的关键所在。今天,就让我们一同来揭开全自动跟拍智能云台驱动板方案的神秘面纱
    的头像 发表于 10-09 17:29 355次阅读
    艾毕胜电子全自动跟拍智能云台驱动板方案的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>

    用智能DAC揭开医疗报警设计的神秘面纱

    电子发烧友网站提供《用智能DAC揭开医疗报警设计的神秘面纱.pdf》资料免费下载
    发表于 09-14 10:50 0次下载
    用智能DAC揭开医疗报警设计的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>

    OpenAI宣布启动GPT Next计划

     9月4日最新资讯,OpenAI Japan 在KDDI峰会上亮相,揭开了其即将问世的下一代AI模型的神秘面纱,并正式宣布了旨在2024年启动的GPT Next宏伟计划。
    的头像 发表于 09-04 14:51 633次阅读

    北斗卫星时钟——揭开“授时”的神秘面纱

    ,这些时间信息又是从哪里来的呢?为什么我们可以随时随地都能获取准确的时间信息?这得益于高精度的 授时服务 ,今天我们就来揭开“授时”的神秘面纱。      大家都知道我国的北斗导航卫星,是用于定位导航的。那么北斗是怎么进行定位导航
    的头像 发表于 07-25 16:21 443次阅读
    北斗卫星时钟——揭开“授时”的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>

    深入分析:常说的3H原则在PCB设计中的应用

    “3H”这个设计经验我们一直在传颂,到底它在具体PCB设计项目中到底效果怎么样呢?话不多说,本期文章从理论到实际给大家全面分析,揭开它那神秘面纱
    的头像 发表于 07-15 16:49 557次阅读
    深入分析:常说的3H原则在PCB设计中的应用

    xAI公司将在八月揭开其新Grok-2大语言模型的神秘面纱

    在科技界的浩瀚星空中,埃隆·马斯克的每一次发声都如同璀璨的新星,瞬间照亮前行的道路。近日,这位科技巨擘在推特上的一则简短宣告,再次将全球的目光聚焦于人工智能的前沿阵地——他的初创公司xAI即将在八月揭开其最新力作Grok-2大语言模型的神秘面纱
    的头像 发表于 07-02 11:38 507次阅读

    揭开Pluto XZU20的神秘面纱—探寻未来紧凑而强大的FPGA解决方案

    创新成果具有挽救生命、改变生活和创造梦想的能力。现在让我们一起紧随Pluto产品发布会的步伐,揭开PlutoXZU20的神秘面纱,与我们一起探寻未来紧凑而强大的FP
    的头像 发表于 06-21 08:09 392次阅读
    揭开Pluto XZU20的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>—探寻未来紧凑而强大的FPGA解决方案

    揭开快充芯片的神秘面纱

    UFP芯片是一种用于USB快充技术的关键元件,它在移动设备和充电器之间进行通信和协调,以实现高效、安全、快速的充电过程。下面我们将揭开快充芯片的神秘面纱,深入探讨UFP快充芯片的工作原理和功能。
    的头像 发表于 04-15 12:51 651次阅读

    UFP芯片-揭开快充芯片的神秘面纱

    什么是UFP芯片呢? UFP芯片是快充协议芯片的一种类型,主要应用场景为无线充电器、快充电动工具、快充诱骗线等领域。它与充电端(DFP)协议芯片和双角色端(DRP)芯片共同构成了快充协议芯片的主要类型。     UFP芯片的主要功能是什么? UFP芯片,即受电端协议芯片,是快充技术中的关键组件。它的主要功能是在快充过程中,与充电端(通常是充电器或充电设备)进行通信和协商,以确保安全、高效、快速地充电。 具体来说,UFP芯片在接收到充电请
    的头像 发表于 04-13 20:00 789次阅读
    UFP芯片-揭开快充芯片的<b class='flag-5'>神秘</b><b class='flag-5'>面纱</b>

    英伟达GTC大会将开幕 人形机器人成英伟达GTC议题

    英伟达创始人兼CEO黄仁勋将在北京时间3月19日凌晨发表主题演讲,预计他将为我们揭开新一代硬件产品的神秘面纱
    的头像 发表于 03-18 15:14 1651次阅读

    芯讯通打造了基于高通最新一代骁龙®X75和X72 5G调制解调器

    随着ChatGPT、文心一言等AIGC大模型的崛起,AI的神秘面纱逐渐被公众揭开。
    的头像 发表于 03-14 10:00 1173次阅读

    AQY212S光耦合器:特性和应用揭秘

    让我们深入研究AQY212S的功能和应用,揭开这款令人印象深刻的器件的神秘面纱
    的头像 发表于 01-19 16:01 1210次阅读
    AQY212S光耦合器:特性和应用揭秘