人工智能实现触觉和视觉的信息交互-电子发烧友网

在加拿大作家玛格丽特•阿特伍德的著作《盲人杀手》中有这样一段描述：“触觉，先于视觉也先于语言，既是第一语言也是最后的语言，并总是诉说真相。”

被编写为视觉或者触觉的机器人一般不能实现此两种感官信息的交互。为打破这种隔绝，来自MIT（麻省理工学院）CSAIL（计算机科学与人工智能实验室）的研究团队提出了一种可预测AI，它可以通过触觉信息的训练学习到视觉特征，反之亦然，也能通过视觉信息的训练学习到物体的触觉特征。

该团队所提出的模型可以从视觉信号中“创造”出逼真的触觉信号，并直接利用触觉信息预测所检测目标及触摸部位。他们使用的库卡机械臂上装有一个特殊的触觉传感器GelSight，这是由MIT的另一研究团队设计的。

该团队利用一个简单的网络摄像头采集了近200种物体图像，包括工具、家庭用品、纺织物等，这些物体被“触摸”超过12000次。通过将这12000个小视频分解为静态帧从而生成了名为“VisGel”的数据集，该数据集包含300多万个视觉-触觉对应的图像。

CSALL博士生Yunzhu Li在其一篇相关论文中谈到：“通过观察触摸情景，我们的模型可以“想象”出触摸平坦表面或者尖锐边缘的感觉”，“当机器人只有触觉感官的时候，此模型可以仅凭触觉信号来完成和周围环境的交互。将触觉和视觉这两种感官结合在一起无疑是锦上添花。它还可能减少机器人为完成抓取任务所需的数据集”。

目前使能机器人具备更多感官能力的研究，比如MIT在2016年的项目：利用深度学习实现声音可视化、预测物体对外力反应，都使用了大量的训练数据，但不能实现视觉和触觉的交互。该团队使用VisGel数据集和生成式对抗网络（GANs）实现上述功能。

此GANs算法利用视觉或触觉的图像生成其他形式的图像。其原理简而言之，就是GANs利用生成器（generator）捏造假的图像试图骗过判别器（discriminator），判别器将辨别结果反馈给生成器以调参，以使得生成器生成更高质量的预期图像，如此相得益彰。

所见即所触

人可以通过观察物体来判断其手感，欲将这种能力赋予机器人，首先要标定目标位置，其次要推断目标区域的形状和手感。

为此，需要一张参考图像，它记录了机器人没有与外界交互时的所处的环境信息。模型在识别过程中会对比当前捕捉到的帧图像和参考图像以轻松判断所触物体的位置和大小。

好比给模型“看”了一张鼠标的图像，模型将预测可能触碰到鼠标的区域，并告诉机器人从而使其实现安全高效的抓取任务。

所触即所见

利用触觉数据产生视觉图像即所谓“所触即所见”。模型通过观察触觉图像推断所接触位置的物体形状和材质，并和参考图像对比进而“想象”出交互过程。

举个例子，将一只鞋的触觉数据传给模型，其输出将是一张图像，这张图像则显示了最有可能触摸到这只鞋的区域位置。

当灯被关掉，或者盲人进入未知区域的时候，这种技能就可以发挥其作用了。

展望

目前的训练数据只能实现特定环境下的交互。该团队希望收集更复杂环境下的训练数据以提升模型的泛化性能。MIT的新设计——tac tile glove或许可以帮助他们获取更多更密集的训练数据。

翘首以盼，此类模型将协助机器人和其视觉紧密合作以实现无缝的人机交互。这些合作包括对象识别、抓取、场景理解等。

加州大学伯克利分校的博士后Andrew Owens说：“这是首次提出的视觉和触觉信号可靠的转换方法，此类方法于机器人而言将大有裨益，彼时，它们就可以回答诸如‘这东西的硬度如何？’，‘如果我用手柄握住马克杯，我会握得多好？’的问题，这是一个十分有挑战性的项目，因为问题的信号是如此的不同，其优越性也可见一斑”。

李和MIT的教授Russ Tedrake 、 Antonio Torralba，博士后Jun-Yan Zhu共同完成这篇论文。它将于下周在加利福尼亚长沙滩上举办的计算机视觉及模式识别大会上发布。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1797

文章
47908

浏览量
240923
MIT

MIT

+关注

关注
3

文章
253

浏览量
23531

原文标题：所见即所触，教AI实现触觉和视觉的信息交互

文章出处：【微信号：BigDataDigest，微信公众号：大数据文摘】欢迎添加关注！文章转载请注明出处。

嵌入式和人工智能究竟是什么关系?

嵌入式和人工智能究竟是什么关系? 嵌入式系统是一种特殊的系统，它通常被嵌入到其他设备或机器中，以实现特定功能。嵌入式系统具有非常强的适应性和灵活性，能够根据用户需求进行定制化设计。它广泛应用于各种

发表于 11-14 16:39

如何利用FPGA技术革新视觉人工智能应用？

嵌入式视觉人工智能应用通过在边缘实现高度复杂的实时视频流处理和决策，正在为各行各业带来变革。这些应用范围从自动驾驶到智能制造，其中快速分析视觉

发表于 10-16 08:03 •528次阅读

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

、优化等方面的应用有了更清晰的认识。特别是书中提到的基于大数据和机器学习的能源管理系统，通过实时监测和分析能源数据，实现了能源的高效利用和智能化管理。其次，第6章通过多个案例展示了人工智能在能源科学中

发表于 10-14 09:27

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

周末收到一本新书，非常高兴，也非常感谢平台提供阅读机会。这是一本挺好的书，包装精美，内容详实，干活满满。《AI for Science：人工智能驱动科学创新》这本书的第一章，作为整个著作的开篇

发表于 10-14 09:12

risc-v在人工智能图像处理应用前景分析

与人工智能推荐系统中强大的图形处理器（GPU）一争高下。其独特的设计使得该处理器在功耗受限的条件下仍能实现高性能的图像处理任务。 Ceremorphic公司：该公司开发的分层学习处理器结合了

发表于 09-28 11:00

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

！《AI for Science：人工智能驱动科学创新》这本书便将为读者徐徐展开AI for Science的美丽图景，与大家一起去了解： 人工智能究竟帮科学家做了什么？ 人工智能将如何改变我们所生

发表于 09-09 13:54

报名开启！深圳（国际）通用人工智能大会将启幕，国内外大咖齐聚话AI

呈现、产业展览、技术交流、学术论坛于一体的世界级人工智能合作交流平台。本次大会暨博览会由工业和信息化部政府采购中心、广东省工商联、前海合作区管理局、深圳市工信局等单位指导，深圳市人工智能产业协会主办

发表于 08-22 15:00

FPGA在人工智能中的应用有哪些？

FPGA（现场可编程门阵列）在人工智能领域的应用非常广泛，主要体现在以下几个方面：一、深度学习加速训练和推理过程加速：FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性

发表于 07-29 17:05

机器视觉和人工智能的关系与应用

释视觉信息的技术。它涉及到图像的获取、处理、分析和解释，以实现对物体、场景和事件的识别、定位、测量和分类。机器视觉系统通常由图像采集设备、图像处理软件和执行器组成，可以应用于各种自动化

发表于 07-16 10:27 •1117次阅读

计算机视觉与人工智能的关系是什么

引言计算机视觉是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域的知识。人工智能则是研究如何使计算机具有

发表于 07-09 09:25 •794次阅读

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V2）

https://t.elecfans.com/v/25653.html 人工智能 初学者完整学习流程实现手写数字识别案例_Part1 13分59秒 https://t.elecfans.com/v

发表于 05-10 16:46

声通科技：Voicecomm Suites引领企业交互式人工智能新风尚

随着科技的快速发展，人工智能和通信技术不断融合，为企业级用户带来了前所未有的商业机遇。在这个大背景下，上海声通信息科技股份有限公司（以下简称“声通科技”）凭借其在交互式人工智能领域的深

发表于 04-12 12:02 •329次阅读

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

://t.elecfans.com/v/25653.html 人工智能 初学者完整学习流程实现手写数字识别案例 28分55秒 https://t.elecfans.com/v/27184.html

发表于 04-01 10:40

声通科技全栈交互式人工智能，助力企业智能化升级

在数字化浪潮席卷全球的今天，人工智能已经成为企业转型升级、提升竞争力的关键力量。上海声通信息科技股份有限公司（以下称：声通科技或公司）作为中国第二大企业级全栈交互式人工智能解决方案提供

发表于 03-20 09:56 •414次阅读

嵌入式人工智能的就业方向有哪些?

联网ARM开发 NB-IoT开发及实战七：python工程师，人工智能工程师 python语法基础 python核心编程基于OpenCV的机器视觉开发嵌入式人工智能渗入生活的方方面面，广泛应用

发表于 02-26 10:17

搜索历史

人工智能实现触觉和视觉的信息交互

评论

嵌入式和人工智能究竟是什么关系?

如何利用FPGA技术革新视觉人工智能应用？

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

risc-v在人工智能图像处理应用前景分析

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

报名开启！深圳（国际）通用人工智能大会将启幕，国内外大咖齐聚话AI

FPGA在人工智能中的应用有哪些？

机器视觉和人工智能的关系与应用

计算机视觉与人工智能的关系是什么

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V2）

声通科技：Voicecomm Suites引领企业交互式人工智能新风尚

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

声通科技全栈交互式人工智能，助力企业智能化升级

嵌入式人工智能的就业方向有哪些?