利用人工智能和机器人技术实现复杂的自动化任务！-电子发烧友网

这篇mylangrobot项目由neka-nat创建，本文已获得作者Shirokuma授权进行编辑和转载。

https://twitter.com/neka_nat

GitHub-mylangrobot ：GitHub - neka-nat/mylangrobot: Language instructions to mycobot using GPT-4V

引言
本项目创建了一个使用GPT-4V和myCobot的一个演示，演示机械臂简单得到拾取操作，这个演示使用了一个名叫SoM（物体检测对象）的方法，通过自然语言生成机器人动作。通俗点换一句话来说就是，机器接受自然语言，去寻找目标然后让机械臂进行抓取的一个案例。

本项目的亮点主要是GPT-4V的图像处理和SoM物体检测算法相结合，通过自然语言和机器交互实现机械臂运动。

软件
SoM
Set of Mark(SoM)是一种用于增强大型语言模型的视觉理解能力。图像经过SoM处理之后能够在图像上添加一系列的标记，这些标记能够被语言类模型识别和处理。这些标记有助于模型更准确的识别和理解图像中的物体和内容。

这使得语言模型能够针对图像中的元素进行更精准的分析和描述，从而提高其在视觉任务上的表现。

GPT-4V
我们常聊的GPT是一个大预言模型，我们可以跟它进行对话聊天。在迭代新的版本的GPT-4V是一个大模型多模态语言模型，它不单单能处理文本信息，现在还能够处理图像信息。能够对图像理解，图像生成，图像描述的功能，这样大模型结合GPT-4的强大自然语言处理能力和现金的图像分析技术，可以提供更高效和更准确的视觉和语言综合能力。

下面是OpenAI 提供的例子

简要介绍：将一个视频提供给GPT4,通过GPT-4V对图像的处理，生成对视频讲解的内容的过程。原文链接：Processing and narrating a video with GPT's visual capabilities and the TTS API | OpenAI Cookbook

User:
"These are frames from a video that I want to upload. Generate a compelling description that I can upload along with the video."

视频中某一帧的图像

#GPT-4V对图像的描述处理
GPT4:
"

审核编辑 黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
210

文章
28141

浏览量
206001
人工智能

人工智能

+关注

关注
1791

文章
46734

浏览量
237258
GPT

GPT

+关注

关注
0

文章
351

浏览量
15295
机械臂

机械臂

+关注

关注
12

文章
507

浏览量
24469

人工智能机器人关节控制板BGA芯片底部填充用胶方案

、制造业、安保及家居生活等多个领域，人工智能机器人正发挥着不可或缺的作用。从扫地、拖地到宠物陪伴、儿童看护，它们的应用场景愈发多样化。为确保这些机器人在各种

发表于 11-15 09:56 •62次阅读

<b class='flag-5'>人工智能</b><b class='flag-5'>机器人</b>关节控制板BGA芯片底部填充用胶方案

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

的自适应性和自主性，赋能机器人在多种场景中的应用。例如，在家庭自动化领域，具身智能机器人能够感知家庭成员的日常习惯和需求，自动执行清洁、整

发表于 11-11 10:20

下一代机器人技术：工业自动化的五大趋势

随着人工智能(AI)技术的迅猛发展和全球制造业的转型升级，下一代机器人技术正在引领工业自动化领域的新一轮变革。这些变革不仅深刻影响着生产模式

发表于 10-23 15:52 •440次阅读

关于全自动装车机器人的详细介绍

全自动装车机器人是一种人工智能和自动化技术，能够自动识别和定位货物，并

发表于 10-22 16:43 •155次阅读

报名开启！深圳（国际）通用人工智能大会将启幕，国内外大咖齐聚话AI

呈现、产业展览、技术交流、学术论坛于一体的世界级人工智能合作交流平台。本次大会暨博览会由工业和信息化部政府采购中心、广东省工商联、前海合作区管理局、深圳市工信局等单位指导，深圳市人工智能

发表于 08-22 15:00

英伟达利用人工智能和Omniverse加速人形机器人开发

8月6日，英伟达揭晓了一项创新工作流程，该流程深度融合了人工智能技术与其Omniverse平台，旨在为人形机器人的研发按下加速键。通过巧妙结合苹果Vision Pro的先进功能与英伟达的人工智能

发表于 08-06 17:29 •661次阅读

FPGA在人工智能中的应用有哪些？

以承担机器人路径规划、环境感知、运动控制等任务，结合外部传感器的反馈信息，实现高效、准确的机器人控制系统。四、优势总结高并行性：FPGA的高并行性使其在处理大规模并行运算时具有显著

发表于 07-29 17:05

人工智能与机器人的区别

在当今科技飞速发展的时代，人工智能（AI）和机器人已成为社会关注的热点话题。尽管两者在多个领域有着广泛的应用和交集，但它们本质上是两个不同的概念。本文将从定义、技术方向、功能、应用范围、研究重点及未来发展等方面，详细探讨

发表于 07-04 17:41 •2073次阅读

机器人视觉的应用范围

机器人视觉是一种将计算机视觉技术应用于机器人领域的技术，它使得机器人能够感知和理解周围环境，实现

发表于 07-04 11:33 •497次阅读

其利天下技术·搭载无刷电机的扫地机器人的前景如何？

随着人工智能和物联网技术的不断进步，扫地机器人的智能化程度也在不断提高。现代扫地机器人已经可以通过智能

发表于 05-05 15:03

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

*附件：初学者完整学习流程实现手写数字识别案例.pdf 人工智能 语音对话机器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件：语音对话机

发表于 04-01 10:40

晶泰科技携手ABB机器人打造柔性智能自动化的实验室

晶泰科技与ABB机器人联合打造柔性自动化、智能化的未来实验室，让自动化设备成为科研人的手中利器，成为突破各科研领域效率瓶颈的日常工具。

发表于 01-19 16:49 •1110次阅读

创想焊缝跟踪系统适配欢颜机器人真正实现焊接自动化和智能化

一起了解创想焊缝跟踪系统适配欢颜机器人的应用。激光焊缝跟踪系统原理：激光焊缝跟踪系统是一种先进的焊接技术，其原理是利用高精度的传感器对焊缝进行实时检测，并通过对数据的处理和分析，

发表于 01-13 15:43 •352次阅读

上下料机器人，他可以替代人工执行自动化的物料搬运任务

“上下料机器人” 可能指的是自动上料和下料的机器人系统，通常用于工业生产线。这些机器人系统可以执行自动化的物料搬运

发表于 01-08 15:53 •476次阅读

网络社交机器人检测的关键技术

在线社交网络面临着网络社交机器人操控的威胁，而现有的检测算法还不能缓解这种威胁。如何有效利用人工智能技术检测社交机器人，规避其潜在的风险并保障网络的良好生态，是当前亟需解决的重要任务。

发表于 12-28 17:05 •938次阅读

搜索历史

利用人工智能和机器人技术实现复杂的自动化任务！

评论

人工智能机器人关节控制板BGA芯片底部填充用胶方案

【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮！

下一代机器人技术：工业自动化的五大趋势

关于全自动装车机器人的详细介绍

报名开启！深圳（国际）通用人工智能大会将启幕，国内外大咖齐聚话AI

英伟达利用人工智能和Omniverse加速人形机器人开发

FPGA在人工智能中的应用有哪些？

人工智能与机器人的区别

机器人视觉的应用范围

其利天下技术·搭载无刷电机的扫地机器人的前景如何？

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

晶泰科技携手ABB机器人打造柔性智能自动化的实验室

创想焊缝跟踪系统适配欢颜机器人真正实现焊接自动化和智能化

上下料机器人，他可以替代人工执行自动化的物料搬运任务

网络社交机器人检测的关键技术