Waymo用AutoML自动生成机器学习模型-电子发烧友网

Waymo十周年之际，发布了自动驾驶机器学习模型的构建思路，原来很多内部机器学习架构是由 AutoML 完成的。这种自动机器学习算法在激光雷达分割任务中，比人工创建的网络质量更高。在代理端到端搜索中，甚至发现了卷积、池化和反卷积操作的创造性组合，不禁让人感叹算法工程师要失业？

AutoML 全称是 Automated Machine Learning，是2014年以来，机器学习和深度学习领域最炙手可热的领域之一。2017年5月，谷歌在I/O大会上推出基于TensorFlow 框架下的AutoML，它可以通过神经网络来设计神经网络，节省人工设计的时间，其对专业知识的较低，让非机器学习专家也能轻松上手。而在近日waymo十周年上曝光，其AutoML 已经用来设计应用于自动驾驶上的机器学习算法。

在Waymo，机器学习几乎应用在自动驾驶系统的每个角落。它可以帮助无人车感知周围环境，了解世界，预测其他人的行为方式，并预测他们的下一步行动。

以感知为例，Waymo的系统采用了神经网络的组合，使无人车能够解读传感器数据、识别物体，并随着时间的推移跟踪它们，从而对周围的世界有一个深入的了解。这些神经网络的创建通常是一项耗时的任务，优化神经网络架构以实现在自动驾驶汽车上运行所需的质量和速度是一个复杂的微调过程，需要花费工程师数月时间完成任务。

通过与谷歌AI大脑团队研究人员合作，应用AutoML将前沿研究付诸实践，以自动生成神经网络。更重要的是，这些最先进的神经网络比工程师手动微调质量更高和速度更快。

Waymo 为了将自动驾驶技术应用到不同的城市和环境中，需要以极快的速度优化现有模型以适应不同的场景。恰好 AutoML 能够做到这一点，并高效，持续地提供大量的ML解决方案。

应用现有的AutoML框架进行迁移学习

Auto ML能否为汽车生成高质量、低延迟的神经网络?

质量往往是衡量一个神经网络产生的答案的准确性的标准，延迟数据决定了神经网络提供答案的速度，也称为推理时间。由于自动驾驶是一项需要无人车快速做出决定以保证安全的系统，因此神经网络需要保证在低延迟下进行。运行在Waymo无人车上的大多数网络，延迟都少于10毫秒，这比部署在数千台服务器上的数据中心中的许多网络都要快。

Google AI团队在2018年4月发表的论文（Learning Transferable Architectures for Scalable ImageRecognition）中，能够自动探索超过12,000种架构来完成 CIFAR-10 数据集的经典图像识别任务，其中发现的自我创建的NAS单元比手工创建神经网络更好。将在CIFAR-10上学到的知识转移到自动驾驶任务中，它可以很好的完成语义分割的任务，比如将LiDAR点云中的每个点标识为汽车，行人，树等。

NAS单元处理神经网络中前两个层的输入

通过构建一种自动搜索算法，在卷积网络架构（CNN）中探索数百种不同的NAS单元组合，进行 LiDAR 分割任务训练和评估模型。如果采用人工微调，只能探索有限数量的架构，但通过这种方法，自动探索了数百个。

相比人工微调优化神经网络，AutoML输出的神经网络做到了低延迟、高质量效果。

初步成功后，Waymo将相同的搜索算法应用于另外两个与交通车道检测和定位相关的任务，迁移学习技术也适用于这些任务，最后能够在无人车上部署三个新训练和改进的神经网络。

端到端搜索：从头开始搜索新的架构

发现AutoML巨大潜力后，Waymo开始思考是否可以更进一步、更广泛地寻找能够提供更好结果的全新架构。不局限于NAS单元，可以更直接地找到延迟在限定范围内的架构。

进行端到端搜索往往需要手动探索数千个架构，需要大量的计算成本。找到单一架构需要在多个GPU的计算机上训练好几天，这意味着搜索单个任务需要数千天的计算时间。相反，通过设计一个代理任务：一个缩小的激光雷达分割任务，可以在几个小时内解决。

这就意味着需要找到一个与最初的细分任务足够相似的代理任务。在确定代理任务上的架构质量与原始任务上的架构质量之间的良好相关性之前，对几个代理任务设计进行试验。然后，启动一个类似于AutoML论文的搜索，完成一个端到端代理搜索。这是这个概念第一次应用在激光雷达数据上。

代理端到端搜索：在按比例缩小的代理任务中探索数千个架构，将100个最佳应用程序应用于原始任务，验证并部署最佳的最佳体系结构。

通过使用几种搜索算法，优化质量和延迟。查看不同类型的CNN架构并使用不同的搜索策略，如随机搜索和强化学习，能够为代理任务探索10,000多种不同的架构。通过使用代理任务，在Google TPU集群上花费一年多的计算时间现在只需要两周时间。在NAS单元之外，我们发现了比以前更好的神经网路，它在相同的质量下，神经网络的延迟降低20-30%；具有更高质量的神经网络，错误率降低8-10%，与以前的架构具有相同的延迟。

左图展示了在一组简单的架构上随机搜索发现的大约4000个架构。每个点都是一个经过训练和评估的架构。实线表示不同推理时间约束下的最佳架构，红点表示用迁移学习构建的网络的延迟和性能。在这种随机搜索中，网络学习效果不如迁移学习。右图中，黄色和蓝色的点表示另外两种搜索算法的结果。黄色的是对一组精致架构的随机搜索。蓝色的那个使用了强化学习，探索了6000多个架构。它产生了最好的结果。这两个额外的搜索发现，该网络明显优于迁移学习的网络。

在搜索中发现的一些架构采用了卷积、池化和反卷积操作的创造性组合，如下图所示。这些架构最终非常适合最初的激光雷达分割任务，并将部署在Waymo的自动驾驶汽车上。

由代理端到端搜索发现的一种神经网络结构。

Waymo与Google AI合作，应用 AutoML 在无人驾驶上的实践仅仅是个开始。对于激光雷达分割任务，传输学习和代理端到端搜索都提供了比人工创建更好的网络，这些机制应用到新的任务类型上，可以改善许多其他的神经网络。这一发展为未来的ML工作开辟了新的道路，并提高了Waymo的自动驾驶技术的性能和能力。

看到这里是不是觉得很兴奋，自己费尽心思搭的神经网路，AutoML 只需很短的时间就能得出高质量的网络结构。当然，目前谷歌只开源了轻量级 AutoML 框架——AdaNet。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8460

浏览量
133412
waymo

waymo

+关注

关注
2

文章
312

浏览量
24835

原文标题：算法工程师要失业？Waymo尝试用AutoML自动生成机器学习模型

文章出处：【微信号：IV_Technology，微信公众号：智车科技】欢迎添加关注！文章转载请注明出处。

机器学习模型市场前景如何

当今，随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升，机器学习模型的市场前景愈发广阔。下面，AI部落小编将探讨机器学习

发表于 02-13 09:39 •105次阅读

全球的AI+EDA（电子设计自动化）创新项目

for EDA 项目概述：Google研究团队推出了AutoML（自动化机器学习）平台，应用于电子设计自动化领域。该平台利用AI来

发表于 02-07 12:00 •951次阅读

【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

引入GPT这样的大模型后，情况发生了根本性的变化。只需提供适当的提示词以及封装好的机器人函数库，大模型便能灵活地生成控制代码，极大地简化了开发过程，并提高了

发表于 12-29 23:04

《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

医疗领域，手术辅助机器人需要毫米级的精确控制，书中有介绍基于视觉伺服的实时控制算法，以及如何利用大模型优化手术路径规划。工业场景中，协作机器人面临的主要挑战是快速适应新工艺流程。具身智能通过在线

发表于 12-24 15:03

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

迈新步，为其机器人出租车业务引入了一种基于谷歌多模态大语言模型（MLLM）“Gemini”的全新训练模型——“端到端多模态自动驾驶模型”（E

发表于 10-31 16:55 •1291次阅读

AI大模型与深度学习的关系

AI大模型与深度学习之间存在着密不可分的关系，它们互为促进，相辅相成。以下是对两者关系的介绍：一、深度学习是AI大模型的基础技术支撑：深度学习

发表于 10-23 15:25 •1953次阅读

AI大模型与传统机器学习的区别

AI大模型与传统机器学习在多个方面存在显著的区别。以下是对这些区别的介绍：一、模型规模与复杂度 AI大模型：通常包含数十亿甚至数万亿的参

发表于 10-23 15:01 •1693次阅读

【《大语言模型应用指南》阅读体验】+ 基础知识学习

、机器翻译、文本生成等领域具有广泛应用。它们能够基于用户的提问或描述生成相关的答案或执行指令，极大地提升了信息检索和利用的效率。 2. 局限性尽管大语言模型在自然语言理解方面取得了显

发表于 08-02 11:03

【《大语言模型应用指南》阅读体验】+ 基础篇

这个程序不需要程序员编写，而是由计算机自动生成。因此，人工编程方法依赖程序员思考的规则，而自动编程是计算机算法通过分析数据自行创建规则。作者通过类比学生准备高考的过程来说明机器

发表于 07-25 14:33

SensiML开源AutoML解决方案-Piccolo AI发布

：支持AutoML模型构建、传感器数据管理、模型跟踪和嵌入式固件生成。嵌入式ML SDK：SensiML的推理和DSP SDK设计用于在边缘设备上构建和运行DSP和

发表于 07-22 16:53 •858次阅读

如何用C++创建简单的生成式AI模型

生成式AI（Generative AI）是一种人工智能技术，它通过机器学习模型和深度学习技术，从大量历史数据中

发表于 07-05 17:53 •1238次阅读

Al大模型机器人

理解能力强大: AI大模型机器人可以理解和生成自然语言，能够进行复杂的对话和语言任务。它们能够识别语言中的语义、语境和情感，并据此作出适当的回应。广泛的知识储备: 这些模型基于大规模的

发表于 07-05 08:52

人工神经网络与传统机器学习模型的区别

在人工智能领域，机器学习和神经网络是两个核心概念，它们各自拥有独特的特性和应用场景。虽然它们都旨在使计算机系统能够自动从数据中学习和提升，但它们在多个方面存在显著的区别。本文将从多个维

发表于 07-04 14:08 •1818次阅读

AD8275 spice模型“AD8275.cir”自动生成了一个LTspice模型用来仿真，仿真时弹出图片所示窗口如何处理？

我用官网的AD8275 spice模型“AD8275.cir”自动生成了一个LTspice模型用来仿真，仿真时弹出图片所示窗口，如何处理？

发表于 06-04 12:27

【大语言模型：原理与工程实践】揭开大语言模型的面纱

。这一过程的不断迭代使大语言模型的语言理解和生成能力逐步提升。大语言模型在自然语言处理领域应用广泛，尤其在问答系统和机器翻译方面。它能理解用户意图并

发表于 05-04 23:55

搜索历史

Waymo用AutoML自动生成机器学习模型

评论

机器学习模型市场前景如何

全球的AI+EDA（电子设计自动化）创新项目

【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

AI大模型与深度学习的关系

AI大模型与传统机器学习的区别

【《大语言模型应用指南》阅读体验】+ 基础知识学习

【《大语言模型应用指南》阅读体验】+ 基础篇

SensiML开源AutoML解决方案-Piccolo AI发布

如何用C++创建简单的生成式AI模型

Al大模型机器人

人工神经网络与传统机器学习模型的区别

AD8275 spice模型“AD8275.cir”自动生成了一个LTspice模型用来仿真，仿真时弹出图片所示窗口如何处理？

【大语言模型：原理与工程实践】揭开大语言模型的面纱