AI环境探索模型升级缩小搜索范围效率更高-电子发烧友网

近日，卡内基·梅隆大学、脸书等机构的研究人员提出了一个新的AI环境探索模型。这个新模型综合了传统环境探索模型和基于学习方法的环境探索模型的优点，更简单和不易出错。

这项研究已经发表在学术网站arXiv上，论文标题为《利用主动神经SLAM学习探索环境（Learning To Explore Using Ac tive Neural SLAM）》。

论文链接：https://arxiv.org/pdf/2004.05155.pdf

一、ANS模型：真实模拟探索环境

导航能力是智能代理的核心能力之一。导航任务有许多形式，比如点目标任务指导航到特定的坐标，语义导航任务指导航到去特定场景或对象的路径。

不论哪一种任务，在未知环境中导航的核心问题都是如何高效地探索尽可能多的环境。这样才能扩大在未知环境中找到目标的机会，或者在有限的时间里有效地预映射环境。

传统的探索模型原理是用传感器观察几何体。之后有研究者提出了基于学习的导航模型，该模型依据RGB图像直接推测出几何体。

基于学习的导航策略通过端到端（end-to-end）训练神经网络实现，可以处理原始的传感器数据，直接输出代理该执行的操作。这种策略有3个优势：

1、提高了输入方式选择的灵活性；

2、提高显式状态估计误差的稳健性；

3、通过学习掌握真实世界的结构规律性，使代理更有目的性地行动

理论上端到端的学习策略有上述优势，但也有局限性。

首先，纯粹从数据中学习映射、状态评估、路径规划可能会非常昂贵。因此，以往的端到端学习依赖于模仿学习和以百万计的经验框架。

其次，以往针对端到端学习策略的研究缺乏真实性。比如使用的是合成室内环境数据库SUNC、简化了代理动作、运行环境去除了传感器噪音等。

从表现来说，端到端的学习策略也往往比不需要任何学习的传统方法差。

为了解决全面端到端学习的局限性，卡内基·梅隆大学、脸书、伊利诺大学厄巴纳-香槟分校的研究人员推出了“主动神经即时定位与地图构建（ANS，Active Neural SLAM）模型”。

实验设计上，研究人员尽量使模型训练环境更真实，用到了生境模拟器和两个基于真实情景的数据库（Gibson和Matterport），不限制代理的动作，还模拟了传感器噪音。

二、缩小搜索范围，兼顾搜索性能和效率

本项研究中，导航模型的任务是在固定时间内覆盖最大范围。覆盖范围定义为地图中已知被穿越的总面积。

ANS模型包括一个学习神经即时定位与地图构建（SLAM，Simultaneous localization and mapping）模块，一个全局策略（global policy）和一个局部策略（local policy）。它们通过地图和一个分析路径规划器相连。

层次化和模块化的设计和分析规划的使用，大大减小了训练过程中的搜索范围，同时提高了性能和样本效率。

▲模型示意图

训练过程中，学习神经SLAM模块产生自由空间地图，并依据输入的RGB图像和运动传感器数据预测代理的姿势。SLAM模块的学习提升了输入方式的灵活性。

全局策略利用代理的姿势来占据自由空间地图，并把学习现实世界环境布局的结构性规则作为长期目标。全局策略可以探索真实世界环境的布局。

长期目标可以为局部策略生成短期目标。局部策略通过学习，直接从RGB图像中映射出代理应该做出的动作，呈现可视化反馈。

▲模型运行过程示意图

三、ANS模型能探索更大范围，比基线模型性能优秀

利用Gibson训练集，研究人员完成了对ANS模型的训练，运行了1000万帧探索任务的所有基线。结果如下表。

运行结果基于模型在14个未知场景中994次运行的结果进行平均。与最佳基线的24.863m^2/0.789相比，模型的覆盖率为32.701m^2/0.948。这个数值说明，与基线相比，ANS模型在穷尽探索上更有效。

研究人员还对比了模型和基线在较大训练集、较小训练集、全部Gibson训练集中的运行效果。

较小训练集中，ANS模型能在500步探索完未知环境，而基线运行1000步后仍只探索了位置环境的85~90%（上图中）。

较大训练集中，随着情节的发展，ANS模型与基线之间的差距会扩大（上图左）。

基线模型中，代理经常只探索局部区域，这说明它们无法记住长期视野的探索区域，不能进行长期规划。相比之下，ANS采用全局策略，可以记忆探索过的区域，有效地规划并实现长期目标。

受到结果鼓舞，研究人员用ANS模型部署了一个环境探索机器人。通过调整摄相机的高度和垂直视野，并匹配栖息地模拟器，机器人成功探索出一个公寓的生活区域。

结语：ANS模型效率更高，未来或有更多应用

ANS导航模型克服了之前的基于端对端学习策略的缺陷，基于更真实的数据库进行训练，最终探索效率有所提升。

研究人员认为这个模型在未来或许会有更多应用。“未来，ANS模型可以扩展到复杂的语义任务，比如语义目标导航和回答具体问题，这将创建出一个能捕获对象语义属性的地图。”

另外，这个模型也可以与先前的本地化工作结合，在此前创建的地图中重新定位，使之后的导航更高效。

责任编辑：PSY

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31845

浏览量
270674
搜索

搜索

+关注

关注
0

文章
69

浏览量
16690
模型

模型

+关注

关注
1

文章
3372

浏览量
49316
SLAM

SLAM

+关注

关注
23

文章
427

浏览量
31943

添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

DeepSeek 模型的部署与测试，开启这场充满挑战与惊喜的技术探索之旅。 RK3588 开发板：AI 性能担当 RK3588 开发板基于先进的 8nm LP 制程工艺精心打造，其硬件配置堪称豪华，在

发表于 02-14 17:42

企业AI模型部署攻略

当下，越来越多的企业开始探索和实施AI模型，以提升业务效率和竞争力。然而，AI模型的部署并非易事

发表于 12-23 10:31 •211次阅读

昆仑万维天工AI发布升级版AI高级搜索功能

昆仑万维公司近期正式推出了天工AI的最新版本，其中重点升级了AI高级搜索功能。这一新功能旨在满足用户在复杂问题解决、金融投资、科研学术以及文档分析等多个领域的多样化需求。据了解，天工

发表于 11-07 10:47 •559次阅读

英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

速度比原70B大模型提升2.2倍，具备更准确和更高效的运算效率；能够大幅降低运行成本。通过NAS技术微调；大幅降低了内存消耗、计算复杂性；Llama-3.1-Nemotron-51B

发表于 09-26 17:30 •669次阅读

月访问量超2亿，增速113%！360AI搜索成为全球增速最快的AI搜索引擎

与传统搜索引擎不同，作为AI原生搜索引擎的360AI搜索基于公开网络、知识库、大模型三大支柱。借

发表于 09-09 13:44 •596次阅读

月访问量超2亿，增速113%！360<b class='flag-5'>AI</b><b class='flag-5'>搜索</b>成为全球增速最快的<b class='flag-5'>AI</b><b class='flag-5'>搜索</b>引擎

电商搜索革命：大模型如何重塑购物体验？

自我介绍：京东零售搜推算法部算法工程师，专注于大模型技术以及在 AI 助手搜推等领域的应用探索和实践。在 AI 助手，NLP 和搜索领域有十

发表于 08-19 15:09 •354次阅读

ai大模型和传统ai的区别在哪？

的BERT模型使用了33亿个参数，而传统AI模型通常只有几千到几百万个参数。模型复杂度 AI大模型

发表于 07-16 10:06 •1742次阅读

AI搜索新贵弯道超车难

，尤其国内市场，百度一家独大的态势已维持了近20年。不过，AI大模型的到来，打破了这一僵局。2024上半年，AI搜索正成为新共识并迎来了一波热潮，短时间内涌现出了

发表于 07-09 08:05 •231次阅读

STM CUBE AI错误导入onnx模型报错的原因？

使用cube-AI分析模型时报错，该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.

发表于 05-27 07:15

OpenAI的AI搜索也要来了，但我们需要这么多AI搜索么

OpenAI要做AI搜索挑战谷歌这件事已经传了很久，传说中的SearchGPT似乎真的要来了。据软件开发者TiborBlaho爆料，OpenAI的AI搜索产品Sonic-SNC（Sea

发表于 05-10 08:05 •348次阅读

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》2.0

《大语言模型“原理与工程实践”》是关于大语言模型内在机理和应用实践的一次深入探索。作者不仅深入讨论了理论，还提供了丰富的实践案例，帮助读者理解如何将理论知识应用于解决实际问题。书中的案例分析有助于

发表于 05-07 10:30

搭载星火认知大模型的AI鼠标：一键呼出AI助手，办公更高效

搭载星火认知大模型的AI鼠标：一键呼出AI助手，办公更高效在这个AI时代，如果你想在激烈竞争的职场中不被淘汰，讯飞

发表于 03-25 11:52 •582次阅读

AI大模型将如何推动中国产业升级？华为盘古大模型深耕千行万业

AI大模型将如何推动中国产业升级？日前，华为混合云副总裁胡玉海在做客央视网《中国神气局》时，畅谈AI大模型发展趋势以及如何助力产业创新。胡玉

发表于 03-22 10:40 •689次阅读

使用cube-AI分析模型时报错的原因有哪些？

使用cube-AI分析模型时报错，该模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.

发表于 03-14 07:09

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型开发效率提升10倍

的潞晨科技Colossal-AI系统，用户可实现在本地算力平台一键训练、微调、推理、部署大模型，将大模型开发效率提升10倍以上，并将算力效率

发表于 03-01 09:43 •564次阅读

搜索历史

AI环境探索模型升级缩小搜索范围效率更高

评论

添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

企业AI模型部署攻略

昆仑万维天工AI发布升级版AI高级搜索功能

英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

月访问量超2亿，增速113%！360AI搜索成为全球增速最快的AI搜索引擎

电商搜索革命：大模型如何重塑购物体验？

ai大模型和传统ai的区别在哪？

AI搜索新贵弯道超车难

STM CUBE AI错误导入onnx模型报错的原因？

OpenAI的AI搜索也要来了，但我们需要这么多AI搜索么

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》2.0

搭载星火认知大模型的AI鼠标：一键呼出AI助手，办公更高效

AI大模型将如何推动中国产业升级？华为盘古大模型深耕千行万业

使用cube-AI分析模型时报错的原因有哪些？

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型开发效率提升10倍

搜索历史

AI环境探索模型升级 缩小搜索范围效率更高

评论

AI环境探索模型升级缩小搜索范围效率更高