0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于自然语言的轨迹修正方法

3D视觉工坊 来源:3D视觉工坊 2024-01-19 10:45 次阅读

来源:3D视觉工坊

本研究提出了ExTraCT框架,利用自然语言进行轨迹校正。该框架结合了大型语言模型(LLMs)用于自然语言理解和轨迹变形函数。ExTraCT能够根据场景在线生成轨迹修改特征及其自然语言描述,通过LLMs实现用户话语和特征描述的语义匹配,进而将轨迹修改函数应用于初始轨迹,实现对未见过的轨迹和物体配置的泛化。通过模拟和物理机器人手臂上的用户研究,我们验证了使用ExTraCT方法变形的轨迹在80%情况下更准确且更受欢迎,表现优于基线方法。该系统还展示了在操纵任务和辅助喂食任务中的多功能性。

27ecdc44-b656-11ee-8b88-92fbcf53809c.png

读者理解:

这篇文章提出了一种基于自然语言的轨迹修正方法,该方法结合了大型语言模型 (LLM) 和轨迹变形函数。LLM 用于理解自然语言,轨迹变形函数用于根据语言描述对轨迹进行修正。

该方法的优点是:

使用自然语言可以简化轨迹修正的操作,使其更容易被人类理解。

使用 LLM 可以提高轨迹修正的准确性和灵活性。

该方法的缺点是:

LLM 的训练需要大量的数据,这使得该方法的应用受到一定的限制。

1 引言

本文介绍了一个模块化的框架(ExTraCT),将大型语言模型(LLMs)与轨迹变形函数集成,用于通过自然语言进行轨迹校正,而无需进行端到端训练。该框架通过将语言理解与轨迹变形分开,实现了更准确的指令解释,并可泛化到不同的物体配置和轨迹。我们的方法通过用户研究表明,在大约80%的测试案例中,相比使用LLMs但以端到端方式训练的最新方法,我们的方法在准确性和评分上更高。此外,我们的方法在解决失败案例方面也表现出改进的潜力。

28089790-b656-11ee-8b88-92fbcf53809c.png

2 方法

本文介绍了一种用自然语言校正来修改机器人操纵器轨迹的方法。其核心是ExTraCT框架,结合了大型语言模型(LLMs)和轨迹变形函数。主要步骤包括:

问题定义:目标是根据给定环境E、语言校正l和初始轨迹ξ0,找到最可能的轨迹ξ∗。

特征:将可能的轨迹ξ约束在有限的特征集Φ中。特征ϕ对应于轨迹的变形,可以是特定于场景或场景无关的。文本描述和最优特征选择:为每个特征ϕ生成文本描述Tϕ,并利用大型语言模型(LLMs)进行语义匹配,确定最可能的特征ϕ∗,从而获取最可能的轨迹ξ∗。

变形函数:根据选定的特征ϕ∗,使用变形函数δ对初始轨迹ξ0进行修改,考虑环境和运动规划器的约束,最后通过轨迹优化器得到最终的轨迹ξ∗。

该方法突破了以往直接学习自然语言与机器人轨迹或动作之间映射的方式,而是通过语言理解和轨迹变形两个步骤分别进行,提高了指令解释的准确性和可靠性。这种方法在模拟和真实机器人环境的用户研究中显示出了较高的准确性和偏好度。同时,还展示了该框架在不同任务中的应用灵活性,包括物体操纵和辅助喂食等方面。

2819dc12-b656-11ee-8b88-92fbcf53809c.png

2830251c-b656-11ee-8b88-92fbcf53809c.png

28422ce4-b656-11ee-8b88-92fbcf53809c.png

28563e32-b656-11ee-8b88-92fbcf53809c.png

3 总结

本文提出了ExTraCT框架,结合了LLMs的语言模型能力和手工制作特征的轨迹变形,以实现更精确、可解释、可泛化的轨迹校正方法。该方法对理解和执行语言校正取得了改进,并展示了对失败原因的透明解释。未来的工作将致力于扩展特征空间,处理更复杂的语言表达,并探索双向机器人-用户交流。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    4317

    浏览量

    62487
  • 模型
    +关注

    关注

    1

    文章

    3184

    浏览量

    48763
  • 自然语言
    +关注

    关注

    1

    文章

    287

    浏览量

    13339
  • LLM
    LLM
    +关注

    关注

    0

    文章

    279

    浏览量

    310

原文标题:用语言描述修正机械臂轨迹?ExTraCT语言驱动轨迹优化

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自然语言处理包括哪些内容 自然语言处理技术包括哪些

    自然语言处理(Natural Language Processing, NLP)般包括以下内容: 语音识别(Speech Recognition):将人类语言转换为计算机可以理解的形式。 语音合成
    的头像 发表于 08-03 16:22 6922次阅读

    python自然语言

    最近,python自然语言是越来越火了,那么什么是自然语言自然语言(Natural Language )广纳了众多技术,对自然或人类语言
    发表于 05-02 13:50

    自然语言处理怎么最快入门?

    `本文整理自知乎上的个问答,分享给正在学习自然语言处理的朋友们!自然语言处理是什么?自然语言
    发表于 11-28 10:02

    【推荐体验】腾讯云自然语言处理

    `相信大家对NLP自然语言处理的技术都不陌生,它是计算机科学领域和AI领域中的个分支,它与计算机和人类之间使用自然语言进行交互密切相关,而NLP的最终目标是使计算机能够像人类样理解
    发表于 10-09 15:28

    自然语言处理的分词方法

    自然语言处理——75 自动分词基本算法
    发表于 03-19 11:46

    自然语言处理的语言模型

    自然语言处理——53 语言模型(数据平滑)
    发表于 04-16 11:11

    自然语言处理的词性标注方法

    自然语言处理——78 词性标注方法
    发表于 04-21 11:38

    给大家介绍一种软件修正方法

    本文介绍一种三轴正交型传感器正交性的软件修正方法
    发表于 05-07 06:53

    什么是自然语言处理

    什么是自然语言处理?自然语言处理任务有哪些?自然语言处理的方法是什么?
    发表于 09-08 06:51

    一种基于SV采样信号的局部放电监测内同步基准修正方法_路光辉

    一种基于SV采样信号的局部放电监测内同步基准修正方法_路光辉
    发表于 12-31 14:44 1次下载

    深度视频自然语言描述方法

    针对计算机对视频进行自动标注和描述准确率不高的问题,提出一种基于多特征融合的深度视频自然语言描述的方法。该方法提取视频帧序列的空间特征、运动特征、视频特征,进行特征的融合,使用融合的特
    发表于 12-04 14:07 1次下载
    深度视频<b class='flag-5'>自然语言</b>描述<b class='flag-5'>方法</b>

    什么是自然语言处理_自然语言处理常用方法举例说明

    自然语言处理是计算机科学领域与人工智能领域中的个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法自然语言处理是
    发表于 12-28 16:56 1.8w次阅读
    什么是<b class='flag-5'>自然语言</b>处理_<b class='flag-5'>自然语言</b>处理常用<b class='flag-5'>方法</b>举例说明

    自然语言处理怎么最快入门_自然语言处理知识了解

    自然语言处理就是实现人机间自然语言通信,实现自然语言理解和自然语言生成是十分困难的,造成困难的根本原因是自然语言文本和对话的各个层次上广泛存
    发表于 12-28 17:10 5296次阅读

    自然语言处理的概念和应用 自然语言处理属于人工智能吗

      自然语言处理(Natural Language Processing)是一种人工智能技术,它是研究自然语言与计算机之间的交互和通信的门学科。
    发表于 08-23 17:31 1398次阅读

    自然语言处理是什么技术的一种应用

    自然语言处理(Natural Language Processing,简称NLP)是人工智能和语言学领域的个分支,它涉及到使用计算机技术来处理、分析和生成自然语言文本。
    的头像 发表于 07-03 14:18 659次阅读