针对端到端自主驾驶模型的简单对抗实例-电子发烧友网

AI狂想

AI领域正在向两个不同的方向发展，一种是小微型计算，另一种则是巨型计算。

本周热门学术研究

针对端到端自主驾驶模型的简单对抗实例

在开发多功能建模框架和模拟基础设施来研究端到端自动驾驶模型的对抗性范例的过程中，研究人员发现，一些十分简单且易于设计的物理条件，会对自动驾驶模型产生一定的对抗性。例如道路上的标记线就能够打破端到端驾驶模型的稳定。

这些范例的对抗性有在很多情况下并不会呈现很强的干扰性，比如直线行驶的时候，但在诸如车辆转弯的其他情况下，则会体现出很强的干扰性。

尽管对于人类来说，区分和避免此类冲突是十分简单的，但对于端到端监视模型而言，这些干扰将造成严重的交通违规问题。在测试和实验中，研究人员使用了CARLA自动驾驶汽车模拟器，证明这些物理扰乱不仅存在，而且在特定的驾驶情况下甚至对于最先进的模型也有相当强的作用。

潜在应用及影响

智能机器学习系统极易受到干扰的问题引发了广泛的担忧。这些研究成果及其理论框架无疑为以后的研究提供了有用的信息，并揭示了端到端深度学习模型的缺陷，便于日后改进。此外，该研究也为人工智能工程师们进一步探索更大范围内深度学习模型可能遭受的攻击提供了重要的见解。

原文：

https://arxiv.org/abs/1903.05157

综合教学视频分析数据集（COIN数据集）

为了解决教学视频数据集缺乏多样性和规模的问题，研究人员最近推出了COIN数据集，该数据集是现在用于综合教学视频分析的最大的视频数据集。

该数据集以分层结构组织，包括大约11827个视频，广泛涵盖了日常生活10个以上领域的180个课题。 COIN数据集中的所有视频都进行了一系列专业注释。此外，研究人员还提出了一个简单有效的方法，可用于捕获不同描述阶段的数据依赖性。这类方法还可同传统方法相结合，以更好地提取教学视频中的关键步骤。

潜在应用及影响

研究人员对于COIN数据集的创建目的十分明确 ——通过丰富的语义分类来建立综合全面的教学视频数据集，为教学视频分析提供基准。通过COIN的建立，研究人员也希望推动AI社区未来对教学视频分析的深入研究。

COIN数据集：

https://coin-dataset.github.io/

原文：

https://arxiv.org/abs/1903.02874v1

不牺牲准确性的量化

通常情况下，量化会降低模型精度。尽管如此，研究人员依旧致力于通过改进量化技术，从而减少量化过程中精确度的降低。在最近的一篇论文中，他们提出了一种可以有效地量化模型权重的聚焦量化技术。

论文中所提出的量化方法使用高斯混合表示来定位模型权重分布中的高概率区域，并且以精细水平量化它们。此外，这一量化技术仅使用-2的幂来提供有效的计算模式。

通过一系列整合修剪和编码，他们已经设法在各种CNN上展示出高端压缩比。例如，它们在ResNet-50中达到18.08×的压缩比，在模型精度方面的损失仅为可以忽略不计的0.24％，超过了当前的压缩技术。

潜在应用及影响

与深度神经网络的量化计算集成的量化参数，具有极高的实现大量计算增益和优化性能的能力。该论文所提出的聚焦量化可以使模型尺寸和计算成本降低，并转化为高压缩比，同时提高了当前和未来CNN的效率。

原文：

https://arxiv.org/abs/1903.03046v1

LIGHT：在幻想文本冒险游戏中学习说话和行动

想象一下，如果有一款游戏，多个计算机和人类都可以充当游戏角色，这样的游戏会是什么样呢？研究人员最近推出了这样一款幻想文本冒险游戏，玩家可以在与多个玩家建立对话的同时，进行识、行动和表达等互动。

现有的文字冒险游戏通常是单人的，并且玩家无法在游戏中与人类进行对话，这就是为什么我觉得这个游戏听起来很有趣和有冒险性。

在人与文本的交互游戏中学习（LIGHT），是一款多玩家的幻想文本冒险游戏，旨在帮助机构研究人类间多方面的动态协作对话。

该文本类的游戏设定于一个内涵丰富的游戏世界，其中包括超过660个位置，3460个对象和仅以自然语言定义的1750个字符。研究人员已经收集了大量的数据集（11k集），这些数据集涉及行为，表达和对话等角色驱动的人与人之间的相互作用，其目的是训练模型以类似的方式吸引人类。

测试结果表明，在此条件下训练、生成和检索模型可以有效地利用游戏世界的潜在条件或规则来调节他们的预测。

潜在应用及影响

LIGHT提供了一个可用于在许多不同的任务中共享，培训和评估协作对话模型的统一平台，使人们能够以有趣的方式与机器进行交互。该框架通过提供合适的研究平台，允许研究机构进行多种协作和学习，从而研究和增强现有的协作对话系统。研究人员希望这项工作能够进一步促进和推动基础语言学习的研究工作。

官网：

http://parl.ai/

原文：

https://arxiv.org/abs/1903.03094v1

利用机器学习实现自动机器人的自适应

研究人员提出了一种综合学习和定量规划的方法，其主要目标是在机器人系统等动态和不确定环境中运行的高度可配置系统中实现自适应。该技术使用配置更改作为实施适应的主要机制。

该方法的创新之处在于，它应用机器学习来发现帕累托最优配置，而无需探索所有配置，并将搜索空间的限制应用于可控计划的特定设置。通过这种方式，它可以将学习和定量计划结合起来，以实现运行时的自适应。

此外，该方法有助于在定量规划中整合来自多个模型的信息。具体来说，研究人员探索了需要考虑时间和能量消耗的机器人操作。独立的评估表明，该方法在不确定和动态环境中产生了高质量的适应过程。

潜在应用及效果

作为一种能够有效实现机器人自适应的集成学习和定量规划方法的新技术，该方法可用于许多其他网络物理系统。此外，它还可以作为在线界面扩展到运行时模型更新的界面中。

原文：

https://arxiv.org/abs/1903.03920

其他爆款论文

最近的研究表明，通过演示，你现在可以教机器人完成两个不同的清洁任务。

原文：

https://arxiv.org/abs/1903.05635

在允许可靠的摄像机姿态估计时，如何避免在拍摄的3D场景上泄露机密信息？最近的一项研究提出了一种基于图像的隐私保护定位解决方案。

原文：

https://arxiv.org/abs/1903.05572

谷歌推出了一个新的开放源码库，可以有效地训练巨型神经网络。

网页：

https://ai.googleblog.com/2019/03/introducing-gpipe-open-source-library.html

以下是基于实例和类别级别的6D对象姿态估计，用于增强现实、机器人控制和导航等应用。

原文：

https://arxiv.org/abs/1903.04229

想知道如何在生物医学文本中总结和发现有意义的概念吗？

原文：

https://arxiv.org/abs/1903.02861v1

AI新闻

谷歌发布了一种基于神经网络的端到端语音识别器，以支持最先进的语音识别。

更多信息：

https://ai.googleblog.com/2019/03/an-all-neural-on-device-speech.html

研究人员的好消息：Deep Mind开发了一个开源软件库来帮助他们部署TensorFlow模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
46868

浏览量
237593
自动驾驶

自动驾驶

+关注

关注
783

文章
13685

浏览量
166152
深度学习

深度学习

+关注

关注
73

文章
5493

浏览量
120979

原文标题：最大综合教学视频数据集发布，道路标记线会扰乱自动驾驶稳定性 | AI一周学术

文章出处：【微信号：BigDataDigest，微信公众号：大数据文摘】欢迎添加关注！文章转载请注明出处。

爆火的端到端如何加速智驾落地？

编者语：「智驾最前沿」微信公众号后台回复：C-0551，获取本文参考报告：《智能汽车端到端技术研究报告》pdf下载方式。 “端到

发表于 11-26 13:17 •45次阅读

爆火的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>如何加速智驾落地？

连接视觉语言大模型与端到端自动驾驶

端到端自动驾驶在大规模驾驶数据上训练，展现出很强的决策规划能力，但是面对复杂罕见的驾驶场景，依然

发表于 11-07 15:15 •149次阅读

连接视觉语言大<b class='flag-5'>模型</b>与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动<b class='flag-5'>驾驶</b>

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

迈新步，为其机器人出租车业务引入了一种基于谷歌多模态大语言模型（MLLM）“Gemini”的全新训练模型——“端到端多模态自动

发表于 10-31 16:55 •975次阅读

智己汽车“端到端”智驾方案推出，老司机真的会被取代吗？

随着智能驾驶技术的发展，行业已经从早期基于简单规则和模块化逻辑的自动驾驶，逐步迈向依托深度学习的高复杂度智能驾驶解决方案，各车企也紧跟潮流，先后宣布了自己的

发表于 10-30 09:47 •185次阅读

智己汽车“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智驾方案推出，老司机真的会被取代吗？

端到端InfiniBand网络解决LLM训练瓶颈

的，这需要大量的计算资源和高速数据传输网络。端到端InfiniBand（IB）网络作为高性能计算和AI模型训练的理想选择，发挥着重要作用。在本文中，我们将深入探讨大型语言

发表于 10-23 11:26 •288次阅读

<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>InfiniBand网络解决LLM训练瓶颈

Mobileye端到端自动驾驶解决方案的深度解析

自动驾驶技术正处于快速发展之中，各大科技公司和汽车制造商均在争相布局，试图在这个新兴领域占据一席之地。Mobileye作为全球自动驾驶技术的领军企业之一，凭借其独特的端到

发表于 10-17 09:35 •297次阅读

Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动<b class='flag-5'>驾驶</b>解决方案的深度解析

智驾进程发力？小鹏、蔚来端到端模型上车

转型的关键时期，而智能驾驶技术的发展被视为这场变革的核心动力。作为自动驾驶的支撑技术之一，端到端大模型

发表于 09-26 09:19 •232次阅读

实现自动驾驶，唯有端到端？

，去年行业主流方案还是轻高精地图城区智驾，今年大家的目标都瞄到了端到端（End-to-End, E2E）。端到

发表于 08-12 09:14 •620次阅读

周光：不是真“无图”，谈何端到端

端模型的强因果关系，早在今年4月的北京车展，周光就有此言论，并推出不搭载高精度地图和应用端到端模型

发表于 06-03 11:06 •2856次阅读

小鹏汽车发布国内首个量产上车的端到端大模型

小鹏汽车近日宣布，国内首个端到端大模型量产上车，这一革命性的技术将大幅提升智能驾驶的能力。据小鹏汽车介绍，这一大

发表于 05-28 11:47 •682次阅读

小鹏汽车发布端到端大模型

小鹏汽车近日宣布，其成功研发并发布了“国内首个量产上车”的端到端大模型，该模型可直接通过传感器输入内容来控制车辆，标志着智能

发表于 05-21 15:09 •653次阅读

佐思汽研发布《2024年端到端自动驾驶研究报告》

端到端自动驾驶是直接从传感器信息输入（如摄像头图像、LiDAR等）到控制命令输出（如转向、加减速等）映射的一套系统，最早出现在1988年的A

发表于 04-20 11:21 •2821次阅读

理想汽车自动驾驶端到端模型实现

理想汽车在感知、跟踪、预测、决策和规划等方面都进行了模型化，最终实现了端到端的模型。这种模型不仅

发表于 04-12 12:17 •416次阅读

牵手NVIDIA 元戎启行端到端模型将搭载 DRIVE Thor芯片

NVIDIA的DRIVE Thor芯片适配公司的端到端智能驾驶模型。据悉，元戎启行是业内首批能用 DRIVE Thor芯片适配

发表于 03-25 11:49 •313次阅读

端到端模型卷入智驾圈周光：今年上车！

让AI像人类司机一样开车，今年就能做到。 3月17日，在中国电动汽车百人会汽车新质生产力论坛上，元戎启行CEO周光表示，智能驾驶端到端模型

发表于 03-18 11:17 •483次阅读