机器学习全靠调参?谷歌发布颠覆性研究-电子发烧友网

机器学习全靠调参？这个思路已经过时了。

谷歌大脑团队发布了一项新研究：

只靠神经网络架构搜索出的网络，不训练，不调参，就能直接执行任务。

这样的网络叫做WANN，权重不可知神经网络。

它在MNIST数字分类任务上，未经训练和权重调整，就达到了92%的准确率，和训练后的线性分类器表现相当。

除了监督学习，WANN还能胜任许多强化学习任务。

团队成员之一的大佬David Ha，把成果发上了推特，已经获得了1300多赞：

那么，先来看看效果吧。

效果

谷歌大脑用WANN处理了3种强化学习任务。

（给每一组神经元，共享同一个权重。)

第一项任务，Cart-Pole Swing-Up。

这是经典的控制任务，一条滑轨，一台小车，车上一根杆子。

小车在滑轨的范围里跑，要把杆子从自然下垂的状态摇上来，保持在直立的位置不掉下来。

(这个任务比单纯的Cart-Pole要难一些：

Cart-Pole杆子的初始位置就是向上直立，不需要小车把它摇上来，只要保持就可以。)

难度体现在，没有办法用线性控制器 (Linear Controller) 来解决。每一个时间步的奖励，都是基于小车到滑轨一头的距离，以及杆子摆动的角度。

WANN的最佳网络 (Champion Network) 长这样：

它在没有训练的状态下，已经表现优异：

表现最好的共享权重，给了团队十分满意的结果：只用几次摆动便达到了平衡状态。

第二项任务，Bipedal Waker-v2。

一只两足“生物”，要在随机生成的道路上往前走，越过凸起，跨过陷坑。奖励多少，就看它从出发到挂掉走了多长的路，以及电机扭矩的成本(为了鼓励高效运动) 。

每条腿的运动，都是由一个髋关节、和一个膝关节来控制的。有24个输入，会指导它的运动：包括“激光雷达”探测的前方地形数据，本体感受到的关节运动速度等等。

比起第一项任务中的低维输入，这里可能的网络连接就更多样了：

所以，需要WANN对从输入到输出的布线方式，有所选择。

这个高维任务，WANN也优质完成了。

你看，这是搜索出的最佳架构，比刚才的低维任务复杂了许多：

它在-1.5的权重下奔跑，长这样：

第三项任务，CarRacing-v0。

这是一个自上而下的 (Top-Down) 、像素环境里的赛车游戏。

一辆车，由三个连续命令来控制：油门、转向、制动。目标是在规定的时间里，经过尽可能多的砖块。赛道是随机生成的。

研究人员把解释每个像素 (Pixel Interpretation) 的工作交给了一个预训练的变分自编码器 (VAE) ，它可以把像素表征压缩到16个潜在维度。

这16维就是网络输入的维度。学到的特征是用来检测WANN学习抽象关联 (Abstract Associations) 的能力，而不是编码不同输入之间显式的几何关系。

这是WANN最佳网络，在-1.4共享权重下、未经训练的赛车成果：

虽然路走得有些蜿蜒，但很少偏离跑到。

而把最佳网络微调一下，不用训练，便更加顺滑了：

总结一下，在简单程度和模块化程度上，第二、三项任务都表现得优秀，两足控制器只用了25个可能输入中的17个，忽略了许多LIDAR传感器和膝关节的速度。

WANN架构不止能在不训练单个权重的情况下完成任务，而且只用了210个网络连接(Connections) ，比当前State-of-the-Art模型用到的2804个连接，少了一个数量级。

做完强化学习，团队又瞄准了MNIST，把WANN拓展到了监督学习的分类任务上。

一个普通的网络，在参数随机初始化的情况下，MNIST上面的准确率可能只有10%左右。

而新方法搜索到的网络架构WANN，用随机权重去跑，准确率已经超过了80%；

如果像刚刚提到的那样，喂给它多个权值的合集，准确率就达到了91.6%。

对比一下，经过微调的权重，带来的准确率是91.9%，训练过的权重，可以带来94.2%的准确率。

再对比一下，拥有几千个权重的线性分类器：

也只是和WANN完全没训练、没微调、仅仅喂食了一些随机权重时的准确率相当。

论文里强调，MINST手写数字分类是高维分类任务。WANN表现得非常出色。

并且没有哪个权值，显得比其他值更优秀，大家表现得十分均衡：所以随机权重是可行的。

不过，每个不同的权重形成的不同网络，有各自擅长分辨的数字，所以可以把一个拥有多个权值的WANN，用作一个自给自足的合集 (Self-Contained Ensemble) 。

实现原理

不训练权重参数获得极高准确度，WANN是如何做到的呢？

神经网络不仅有权重偏置这些参数，网络的拓扑结构、激活函数的选择都会影响最终结果。

谷歌大脑的研究人员在论文开头就提出质疑：神经网络的权重参数与其架构相比有多重要？在没有学习任何权重参数的情况下，神经网络架构可以在多大程度上影响给定任务的解决方案。

为此，研究人员提出了一种神经网络架构的搜索方法，无需训练权重找到执行强化学习任务的最小神经网络架构。

谷歌研究人员还把这种方法用在监督学习领域，仅使用随机权重，就能在MNIST上实现就比随机猜测高得多的准确率。

论文从架构搜索、贝叶斯神经网络、算法信息论、网络剪枝、神经科学这些理论中获得启发。

为了生成WANN，必须将权重对网络的影响最小化，用权重随机采样可以保证最终的网络是架构优化的产物，但是在高维空间进行权重随机采样的难度太大。

研究人员采取了“简单粗暴”的方法，对所有权重强制进行权重共享（weight-sharing），让权重值的数量减少到一个。这种高效的近似可以推动对更好架构的搜索。

操作步骤

解决了权重初始化的问题，接下来的问题就是如何收搜索权重不可知神经网络。它分为四个步骤：

1、创建初始的最小神经网络拓扑群。

2、通过多个rollout评估每个网络，并对每个rollout分配不同的共享权重值。

3、根据性能和复杂程度对网络进行排序。

4、根据排名最高的网络拓扑来创建新的群，通过竞争结果进行概率性的选择。

然后，算法从第2步开始重复，在连续迭代中，产生复杂度逐渐增加的权重不可知拓扑（weight agnostic topologies ）。

拓扑搜索

用于搜索神经网络拓扑的操作受到神经进化算法（NEAT）的启发。在NEAT中，拓扑和权重值同时优化，研究人员忽略权重，只进行拓扑搜索操作。

上图展示了网络拓扑空间搜索的具体操作：

一开始网络上是最左侧的最小拓扑结构，仅有部分输入和输出是相连的。

然后，网络按以下三种方式进行更改：

1、插入节点：拆分现有连接插入新节点。

2、添加连接：连接两个之前未连接的节点，添加新连接。

3、更改激活函数：重新分配隐藏节点的激活函数。

图的最右侧展示了权重在[2,2]取值范围内可能的激活函数，如线性函数、阶跃函数、正弦余弦函数、ReLU等等。

权重依然重要

WANN与传统的固定拓扑网络相比，可以使用单个的随机共享权重也能获得更好的结果。

虽然WANN在多项任务中取得了最佳结果，但WANN并不完全独立于权重值，当随机分配单个权重值时，有时也会失败。

WANN通过编码输入和输出之间的关系起作用，虽然权重的大小的重要性并不高，但它们的一致性，尤其是符号的一致性才是关键。

随机共享权重的另一个好处是，调整单个参数的影响变得不重要，无需使用基于梯度的方法。

强化学习任务中的结果让作者考虑推广WANN方法的应用范围。他们又测试了WANN在图像分类基础任务MNIST上的表现，结果在权重接近0时效果不佳。

有Reddit网友质疑WANN的结果，对于随机权重接近于0的情况，该网络的性能并不好，先强化学习实验中的具体表现就是，小车会跑出限定范围。

对此，作者给出解释，在权重趋于0的情况下，网络的输出也会趋于0，所以后期的优化很难达到较好的性能。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6211

浏览量
106487
机器学习

机器学习

+关注

关注
66

文章
8460

浏览量
133412

原文标题：谷歌发布颠覆性研究：不训练不调参，AI自动构建超强网络，告别炼丹一大步

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

BP神经网络的调参技巧与建议

BP神经网络的调参是一个复杂且关键的过程，涉及多个超参数的优化和调整。以下是一些主要的调参技巧与建议：一、学习率（Learning Rat

发表于 02-12 16:38 •201次阅读

LD2410B/C新手必看攻略！测试教程、模块调参一文详解~

关于LD2410B/C那些你不得不知道的事？免费申样、接线教程、参数解析、APP调参教程、上位机调参教程、常见异常情况自检等等内容，一文汇总~不管是萌新小白还是资深玩家，都可以快速入门

发表于 02-05 18:09 •345次阅读

LD2410B/C新手必看攻略！测试教程、模块<b class='flag-5'>调</b><b class='flag-5'>参</b>一文详解~

无压缩机和制冷剂！海尔智家3获颠覆性科技最高奖

效率会骤降甚至失效。海尔智家针对供暖领域的技术探索，迎来了颠覆性突破。近日在工信部主办的第13届中国创新创业大赛颠覆性技术创新大赛上，凭借无压缩机、无制冷剂的“极低温室效应高效大温跨热声热泵”项目，海尔智家成功

发表于 12-24 17:32 •282次阅读

无压缩机和制冷剂！海尔智家3获<b class='flag-5'>颠覆性</b>科技最高奖

依托Chiplet&高性能RDMA，奇异摩尔斩获全国颠覆性技术创新大赛（未来制造领域赛）优胜奖

近日，第十三届中国创新创业大赛颠覆性技术创新大赛（未来制造领域赛）获奖结果出炉，奇异摩尔参赛项目【基于Chiplet+RDMA技术的下一代万卡AI集群的全栈式互联解决方案】荣获优胜奖

发表于 12-19 09:39 •963次阅读

依托Chiplet&高性能RDMA，奇异摩尔斩获全国<b class='flag-5'>颠覆性</b>技术创新大赛（未来制造领域赛）优胜奖

Tata Communications即将推出Kaleyra AI：颠覆性人工智能驱动客户互动

面向未来的人工智能驱动旗舰产品组合——Kaleyra AI，旨在重新定义客户互动的全新体验。这款颠覆性产品组合将首度推出三项独具特色的功能，突破传统通信工具的界限，开创全新互动体验。这款产品套件旨在与各类通信渠道及实时代理界面无缝对接，借助生成式人工智能（GenAI）营造简洁流畅、个性化且极具

发表于 12-15 09:30 •316次阅读

梦之墨荣获全国颠覆性技术创新大赛优秀项目

近日，第十三届中国创新创业大赛颠覆性技术创新大赛（以下简称“大赛”）总决赛在杭州市余杭区圆满结束。大赛聚焦技术革新，旨在引领未来产业的发展方向，促进科技创新成果的转化，加速新质生产力的成长，是全国性的重大赛事。

发表于 12-02 11:40 •517次阅读

梦之墨荣获全国<b class='flag-5'>颠覆性</b>技术创新大赛优秀项目

三相200V转380V带零线颠覆性技术：出口日本变压器引领行业潮流

‌ 三相200V转380V带零线颠覆性技术：出口日本变压器引领行业潮流 ‌ 在全球电气设备贸易的版图中，日本市场以其独特的电力标准和严格的技术要求著称。面对这一挑战，中国电力设备制造商不断创新，推出

发表于 11-20 15:10 •351次阅读

三相200V转380V带零线<b class='flag-5'>颠覆性</b>技术：出口日本变压器引领行业潮流

LSTM神经网络的调参技巧

长短时记忆网络（Long Short-Term Memory, LSTM）是一种特殊的循环神经网络（RNN），它能够学习长期依赖信息。在实际应用中，LSTM网络的调参是一个复杂且关键的过程，直接影响

发表于 11-13 10:01 •1075次阅读

鲁棒性在机器学习中的重要性

在机器学习领域，模型的鲁棒性是指模型在面对输入数据的扰动、异常值、噪声或对抗性攻击时，仍能保持性能的能力。随着人工智能技术的快速发展，机器学习

发表于 11-11 10:19 •727次阅读

深视智能参编《2024智能检测装备产业发展研究报告：机器视觉篇》

为全面了解机器视觉检测装备产业发展情况，中国电子技术标准化研究院联合业内龙头企业、科研院所和产业联盟等（参编单位名单见附件），共同编制了《智能检测装备产业发展研究报告：

发表于 08-05 08:38 •444次阅读

谷歌发布革命性AI天气预测模型NeuralGCM

在科技与自然科学的交汇点上，谷歌公司于7月23日宣布了一项重大突破——全新的人工智能天气预测模型NeuralGCM。这一创新成果不仅融合了机器学习的前沿技术，还巧妙结合了传统气象学的精髓，其研

发表于 07-23 14:24 •614次阅读

【RISC-V信息速递】反X86和ARM垄断？很多人低估了RISC-V的颠覆性

原文标题：【RISC-V信息速递】反X86和ARM垄断？很多人低估了RISC-V的颠覆性文章出处：【微信公众号：RISCV国际人才培养认证中心】欢迎添加关注！文章转载请注明出处。

发表于 06-08 08:36 •300次阅读

手把手教学！HLK-LD2410B/C新手必看攻略！测试教程、模块调参一文详解~

HLK-LD2410B/C接线教程、参数解析、APP调参教程、上位机调参教程、常见异常情况自检等等内容，一文汇总。不管是萌新小白还是资深玩家，都可以快速入门。

发表于 05-31 14:48 •6429次阅读

Chrome浏览器地址栏更新，运用机器学习提升相关性判断准确性

据悉，谷歌成功将机器学习（ML）模型融入Chrome多功能框，以实现更为精准的内容推荐。举例而言，若用户在短时间内关闭某网页，AI便会判定此页非所需，进而降低其相关性得分。

发表于 04-30 11:15 •597次阅读

机器学习8大调参技巧

今天给大家一篇关于机器学习调参技巧的文章。超参数调优是机器学

发表于 03-23 08:26 •799次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

机器学习全靠调参?谷歌发布颠覆性研究

评论

BP神经网络的调参技巧与建议

LD2410B/C新手必看攻略！测试教程、模块调参一文详解~

无压缩机和制冷剂！海尔智家3获颠覆性科技最高奖

依托Chiplet&高性能RDMA，奇异摩尔斩获全国颠覆性技术创新大赛（未来制造领域赛）优胜奖

Tata Communications即将推出Kaleyra AI：颠覆性人工智能驱动客户互动

梦之墨荣获全国颠覆性技术创新大赛优秀项目

三相200V转380V带零线颠覆性技术：出口日本变压器引领行业潮流

LSTM神经网络的调参技巧

鲁棒性在机器学习中的重要性

深视智能参编《2024智能检测装备产业发展研究报告：机器视觉篇》

谷歌发布革命性AI天气预测模型NeuralGCM

【RISC-V信息速递】反X86和ARM垄断？很多人低估了RISC-V的颠覆性

手把手教学！HLK-LD2410B/C新手必看攻略！测试教程、模块调参一文详解~

Chrome浏览器地址栏更新，运用机器学习提升相关性判断准确性

机器学习8大调参技巧