0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT已能操控机器人,工程师连代码都不用写

新机器视觉 来源:量子位 2023-03-27 11:13 次阅读

当我还在跟ChatGPT吹牛尬聊时,有人已经在拿它操控机器人了。

不是别人,正是OpenAI的金主爸爸、不久前刚拿ChatGPT“重新发明搜索引擎”的微软。

472743b0-cbdd-11ed-bfe3-dac502259ad0.png

到目前为止,开发者调教机器人不仅技术门槛高,还道阻且长:

工程师需要在工作流程回路中,不断手写新代码和规范来纠正机器人行为;另外,操控不同的机器人可能需要不同的编程语言和环境。

4749d088-cbdd-11ed-bfe3-dac502259ad0.png

而在ChatGPT的帮助下,工程师甚至不用手写代码——直接用人话描述想做什么,AI就能自动翻译成机器语言。

47859e56-cbdd-11ed-bfe3-dac502259ad0.png

这意味着,一方面专业人士与机器人的交互效率起飞;另一方面,技术门槛也降低一大截,外行人甚至也能参与调试,创造出更多使用方法。

举个简单的例子:让无人机自动检查货架。

首先,操作者只需用自然语言给ChatGPT提出要求;然后,AI就能自动翻译成代码,并指挥无人机行动。(还可以规定无人机的飞行路径。)

47ab8562-cbdd-11ed-bfe3-dac502259ad0.gif

难怪特斯拉前AI主管Andrej Karpathy会调侃:

最新的热门编程语言是英语。

47f419f8-cbdd-11ed-bfe3-dac502259ad0.png

一个AI指挥多种机器人

实际上,ChatGPT会玩儿的花样可多了。

比如,一位操作者跟AI说:“我渴了,请帮我找个喝的。”

此时AI并不会直愣愣地就去找水了,而是会很机灵地反问:

请问你想喝哪种?这里有好几种饮料,比如椰子水、可乐等等。

48077476-cbdd-11ed-bfe3-dac502259ad0.png

当然操作者也不是吃素的,他并未直接告诉AI选哪个,而是说:“我刚从健身房回来,请帮我找个健康点儿的饮料。”

然后更神奇的操作就开始了:

AI先是猜测他想喝椰子水,然后自己噼里啪啦写出一段代码(甚至还有注释):

4827039a-cbdd-11ed-bfe3-dac502259ad0.gif

写完就自己指挥无人机去找椰子水:

483a13a4-cbdd-11ed-bfe3-dac502259ad0.gif

除了无人机,ChatGPT还能轻松操控别的小机器人,包括摄像头、机械臂等等。

比如让摄像头在房间里找出能加热午饭的东西。

4878dddc-cbdd-11ed-bfe3-dac502259ad0.gif

还有指挥机械臂拼出一个微软的Logo。(悄悄夹带私货)

48c23a7c-cbdd-11ed-bfe3-dac502259ad0.gif

看到这些,有网友脑洞大开,有人发问:

他们是不是正在建立无所不能的天网?

49382ade-cbdd-11ed-bfe3-dac502259ad0.png

还有人甚至调侃称,AI可能连发射核弹的指令都会写:

49512cc8-cbdd-11ed-bfe3-dac502259ad0.png

不过话说回来,其实离网友说的这些还差得远,毕竟现在还是需要人类参与的。

怎么实现的?

从前文可以看出,这只灵活的AI不仅与人交流畅通无阻,而且和机器也能快速沟通。

这主要得益于微软团队专门开发的一系列API和高级函数库。

49716844-cbdd-11ed-bfe3-dac502259ad0.png

他们没有让ChatGPT背后的语言大模型(LLM),生成某固定种类的代码;因为机器人是个多元化领域,这样可能会在不同场景下涉及大量微调。

而在新颖的操作框架下,不同机器人,都有自己对应的特定函数库。

——一个AI,就能适应不同的对象、不同的任务。

一方面,这些函数库,能够连接到机器人控制系统中管理底层硬件,以及执行基本运动的代码和功能模块。

另一方面,为了让ChatGPT也能遵循函数库的规则,预定义函数命名就很关键。清晰的函数名,能让各API之间建立良好的功能连接,最终生成高质量的回答。

其中一项要求,就是所有API名称必须描述整体功能行为。例如,detect_object(object_name) 函数可以在内部链接到OpenCV函数或计算机视觉模型。

设计好库和API后,微软给ChatGPT编写了一个文本提示(prompt),描述目标任务,并明确说明函数库中哪些函数可用;另外,这还能规定ChatGPT生成代码用哪种编程语言。

4995e1f6-cbdd-11ed-bfe3-dac502259ad0.png

值得一提的是,AI生成内容效果,和人为提示的质量呈正相关。为此,微软还开发了一个协作开源平台PromptCraft,任何人都能在此分享不同类机器人的Prompt策略。

49bf6e4a-cbdd-11ed-bfe3-dac502259ad0.png

到此,幕后部署基本完成,然后用户就能通过“说人话”间接操控机器人了。

如果想要检查AI生成的代码是否有Bug,随时都能在聊天框直接检查,或通过模拟器测试,人类可以用自然语言指导AI进行修正。

另外,还能到等到用户对解决方案满意为止,再在将ChatGPT生成代码部署到机器人上。

最后,如果是你,会想用ChatGPT操控机器人做些什么呢?

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28190

    浏览量

    206459
  • 编程语言
    +关注

    关注

    10

    文章

    1938

    浏览量

    34593
  • ChatGPT
    +关注

    关注

    29

    文章

    1548

    浏览量

    7477

原文标题:ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    的社会环境。 具身智能机器人在解决实际问题中展现出巨大的潜力,例如,应用在养老、医疗、灾害救援等领域。本书可以为研究人员和工程师提供具体的技术解决方案,帮助他们更好地应用技术,解决现实中的各种问题。 申请
    发表于 11-11 10:20

    工程师组装复合机器人 #智能机器人 #人工智能

    机器人
    fuweizn
    发布于 :2024年10月29日 18:07:20

    ChatGPT 与传统聊天机器人的比较

    随着人工智能技术的飞速发展,聊天机器人已经成为我们日常生活中不可或缺的一部分。从简单的客服助手到复杂的个人助理,这些虚拟助手正在逐渐改变我们与技术的互动方式。在众多聊天机器人中,ChatGPT无疑是
    的头像 发表于 10-25 16:16 411次阅读

    “0元购”智元灵犀X1机器人,软硬件全套图纸和代码全公开!资料免费下载!

    出定制化的运动控制策略。尤其是专业人士或初创团队,基于智元提供的核心组件,可以轻松打造出个性化的人形机器人产品,并借助开源代码快速完成整机工程,极大地降低了研发成本和门槛。 智元灵犀X1的正式开源,旨在
    发表于 10-25 15:20

    机器人仿真的类型和优势

    机器人仿真使机器人工程师和研究人员能够创建机器人及其环境的虚拟模型。这项技术支持在仿真的无风险环境中测试和验证机器人设计与控制算法以及与各种元素进行交互。通过使用仿真软件,可以预测和分
    的头像 发表于 10-14 10:43 410次阅读
    <b class='flag-5'>机器人</b>仿真的类型和优势

    Meta人工智能聊天机器人进军新市场,挑战ChatGPT

    Meta近日宣布,其人工智能聊天机器人将进军21个新市场,与OpenAI的ChatGPT展开激烈竞争。
    的头像 发表于 10-11 16:29 255次阅读

    工程师正在给复合机器人包装# 复合机器人 #AGV

    机器人AGV
    fuweizn
    发布于 :2024年07月23日 17:55:25

    Al大模型机器人

    金航标kinghelm萨科微slkor总经理宋仕强介绍说,萨科微Al大模型机器人有哪些的优势?萨科微AI大模型机器人由清华大学毕业的天才少年N博士和王博士团队开发,与同行相比具有许多优势:语言
    发表于 07-05 08:52

    NVIDIA发布几项新功能来帮助机器人专家和工程师打造智能机器人

      机器人技术在智能制造设施、商用厨房、医院、仓储物流和农业领域等各种环境中的应用正在迅速扩大。该行业正在向智能自动化转型,因此要求机器人具备更强的能力来执行感知、测绘、导航、负载处理、物体抓取
    的头像 发表于 06-29 15:14 1015次阅读
    NVIDIA发布几项新功能来帮助<b class='flag-5'>机器人</b>专家和<b class='flag-5'>工程师</b>打造智能<b class='flag-5'>机器人</b>

    嵌入式软件工程师和硬件工程师的区别?

    机器人等。 定义和工作职责 嵌入式软件工程师的主要职责包括但不限于:设计、开发、测试和调试嵌入式软件应用程序,以满足特定硬件和软件要求。他们需要理解并掌握嵌入式系统的基本原理,熟悉相关硬件接口
    发表于 05-16 11:00

    英伟达推出全新AI聊天机器人

    近日,英伟达(Nvidia)宣布推出其全新的AI聊天机器人——“Chat With RTX”。这款聊天机器人被视为英伟达版的ChatGPT,为用户提供了一个全新的、本地化的AI交互体验。
    的头像 发表于 02-19 11:09 860次阅读

    特斯拉最新消息:特斯拉工厂被曝机器人袭击工程师 特斯拉儿童版cybertruck将进入中国

    特斯拉最新消息:特斯拉工厂被曝机器人袭击工程师 特斯拉儿童版cybertruck将进入中国 特斯拉工厂被曝机器人袭击工程师 有外媒报道称美国特斯拉工厂
    的头像 发表于 12-28 11:11 536次阅读

    开源项目!教你如何复刻自平衡赛车机器人、智能家居中控、竞技机器人先进模糊控制器等

    开源项目作品 为了方便大家更好提升自己,电子发烧友小编为大家整理了一些工程师大佬设计的开源项目作品,供大家可以参考学习,希望对广大工程师有所帮助。 1.用全志R128复刻自平衡赛车机器人,还实现
    发表于 12-26 09:17

    用全志R128复刻自平衡赛车机器人,还实现了三种不同的操控方式

    手柄上的菜单栏UI可以选择不同的机器人基础参数设置和进行机器人操控。 在自平衡机器人启动后,可以通过面包板上的两个手柄去遥控机器人的前进后
    发表于 12-20 10:22