MIT和微软的研究人员开发出一种用于识别智能系统的新模型-电子发烧友网

人工智能的能力我们已经耳熟能详，但它的弱点是什么、它的局限是什么才是我们需要关注的重点。例如，无人驾驶汽车在真实路况中会遇到很多在训练中从未见过的场景，如何处理这种实际与训练不匹配的特殊情形成为了横在研究人员面前的一大难题。

近日，MIT和微软的研究人员开发出一种用于识别智能系统的新模型，特别是自动驾驶系统在训练中学习到的、但是与实际情形不匹配的知识“盲点”，工程师们可利用这一模型识别并改进自动驾驶系统处理特殊情况的措施，提高整个系统的安全性。

无人驾驶汽车的人工智能系统在虚拟仿真环境和数据集中接受了广泛的训练，以便应对道路上可能发生的每一种状况。但是有时候汽车在现实世界中会犯下意想不到的错误，因为对于有些突发事件，汽车应该但却没有做出正确的应对。

如果有一辆未经特殊训练的无人车，在通常的数据集上进行训练后可能无法区分白色的箱式小货车和闪着警报呼啸而至的救护车。当它在公路上行驶时救护车鸣笛经过，由于它无法识别出救护车这个特殊的训练集中缺乏的车型（训练集中一般会标注小货车），它无法知晓此时需要减速和靠边礼让，而这样的无人车在路上行驶时就带来一系列无法预知的交通状况。同样的情形还会出现在与警车、消防车甚至校车同行的路段中。特备对于外卖快递飞驰的电动车、忽左忽右的自行车、随处冲出的行人，无人驾驶系统更是无法处理如此复杂的路况！

为了解决这一问题，研究人员提出了新的训练手段来对无人系统进行更深入的训练和改进。首先研究人员利用先前的方法通过模拟训练建立了人工智能系统。但当系统在现实世界中运行时，会有人密切监视该系统的行为，当系统犯下或将要犯下任何错误时，人类会及时介入为系统提供人类的反馈意见。随后研究人员将训练数据和人类反馈数据结合起来，并使用机器学习技术来生成异常/盲点识别模型，该模型能够准确地指出该系统在哪些地方需要人类介入以便获取更多的信息，从而来引导正确行为。

研究人员通过视频游戏验证了这种方法，他们通过模拟让人类纠正了视频中人物的学习路径。下一步是将该模型与传统的训练和测试方法结合起来，以便训练那些需要人类反馈意见的自动学习系统，比如自动驾驶汽车和机器人。这个模型有助于自动系统更好地了解它们不知道的东西，很多时候对系统进行训练时，它们接受的模拟训练与现实世界发生的事件并不相符，而且系统可能犯错，发生意外事故。这个模型可以用安全的方式以人类行为来弥补模拟和现实世界之间的差距。

一些传统的训练方法确实在真实世界的测试中提供了人类反馈，但是仅仅是为了更新系统的行为动作。这些方法不能识别人工智能系统的盲点。而这种新提出的模型首先将人工智能系统置于模拟训练中，人工智能系统将产生一些“策略”，将每种情况都映射到它在模拟中能采取的最佳行动。然后该系统将被设置到现实世界中，当系统行为错误时人类将发出提醒信号。

人类可以通过多种方式提供数据，例如通过“演示”和“修正”。在演示中，人类像在现实世界中那样行动，系统对其进行观察，并将人类的行为和在这种情况下系统将采取的行为进行比较。以无人驾驶汽车为例，如果汽车的计划路线偏离了人类的意愿，人类会手动控制汽车，这时系统就会发出信号。通过观察人类行为相符或不相符的行为，为系统指出了哪些行为是可接受的，哪些行为是不可接受的。

同时人类还可以对系统进行修正，当系统在现实世界中工作时，人类可以对其进行监控。司机可以坐在驾驶座上，而自动驾驶汽车则沿着计划的路线行驶。如果汽车的行驶是正确的，人类不进行干预。如果汽车的行驶不正确，人类可能会重新控制车辆，这时系统就会发出信号，表明在这种特定情况下汽车采取了不当的行为。

一旦汇集了来自人类的反馈数据，系统就能构建出一个各类情况数据库。单个情况可以接收许多不同的信号，也就是说每种状况可能有多个标签表示该行为是可接受的和不可接受的。例如，一辆自动驾驶汽车可能已经在一辆大车旁边开过了许多次而且没有减速和停车，这是被认可的。但是某次对系统来说和大车完全一样的救护车驶来时，自动驾驶汽车也没有减速或者做出规避动作，此时它就会收到一个反馈信号：系统的行为不恰当。

此刻，该系统已经从人类那里得到了多个相互矛盾的信号：有时它从大车旁边不减速开过去，是可以的；而在相同情况下，只是大车换成了救护车，不减速开过去就不对。这时系统就会注意到它错了，但是它还不知道为什么错，在收集了所有这些看起来相互矛盾的信号后，下一步就是整合信息并提出问题：当收到这些混合信号时，犯下错误的可能性有多大。

这一新模型的最终目标是将这些模棱两可的情况标记为盲点。但这不仅仅是简单地计算每种情况下出现的可接受行为和不可接受行为的次数。例如如果该系统遇到救护车时十次中有九次采取正确的行动，就会将这种情况标记为非盲点。但由于不恰当行为远比恰当行为出现的次数少，系统最终会学会预测所有的情况都不是盲点，这对于实际系统来说是极其危险的。

为此研究人员使用一种通常用于众包数据处理标签噪声的Dawid - Skene机器学习方法来解决这一问题。该算法将各类情况汇总数据库作为输入，每个情况都有“可接受”和“不可接受”的一对噪音标签。然后它聚集所有数据，并使用一些概率计算方法来识别预测盲点标签模式和预测非盲点标签模式。使用这些信息它会为每种情况输出一个整合的“非盲点”或“盲点”标签以及该标签的置信度。值得注意的是，即使在90%的情况下做出了可接受行为，该算法也可以通过学习把罕见的不可接受情况认作盲点。最后该算法将生成了“热图”，系统在原始训练中经历的每种训练情况都被按照从低到高的盲点概率进行排布。

当系统被应用到现实世界中时，它可以利用该学习模型来更加谨慎和智能地行动。如果学习模型预测某种状态是高概率的盲点，系统就可以咨询人类应该如何应对，从而更安全的行动。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

智能识别

智能识别

+关注

关注
0

文章
202

浏览量
18186
自动驾驶

自动驾驶

+关注

关注
785

文章
13958

浏览量
167266
无人车

无人车

+关注

关注
1

文章
304

浏览量
36593

原文标题：MIT&微软开发智能识别新模型，帮助处理自动驾驶系统的知识“盲点”

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

一种高灵敏的化学检测系统

近日，美国加州大学伯克利分校、劳伦斯伯克利国家实验室和Adamas Nanotechnologies公司等机构的研究人员将量子传感与液滴微流控技术相结合，开发出了一种高灵敏的化学检测系统

发表于 01-02 11:35 •148次阅读

【「大模型启示录」阅读体验】+开启智能时代的新钥匙

阅读之旅。在翻开这本书之前，我对大模型的认知仅仅停留在它是一种强大的人工智能技术，可以进行自然语言处理、图像识别等任务。我知道像 ChatGPT 这样的应用是基于大

发表于 12-24 13:10

研究人员利用激光束开创量子计算新局面

演示设备威特沃特斯兰德大学(Wits)的物理学家利用激光束和日常显示技术开发出了一种创新的计算系统，标志着在寻求更强大的量子计算解决方案方面取得了重大飞跃。该大学结构光实验室的研究人员

发表于 12-18 06:24 •154次阅读

rup是一种什么模型

RUP（Rational Unified Process，统一建模语言）是一种软件开发过程模型，它是一种迭代和增量的软件

发表于 07-09 10:13 •1425次阅读

研究人员提出一种电磁微镜驱动系统

领域。MEMS微镜作为一种微光机电系统（MOEMS），已广泛应用于医疗、汽车、消费和军事电子等众多领域。当前，业界对具有广阔前景的小型激光雷达的需求不断增长。之前，已有研究

发表于 07-02 17:04 •1.1w次阅读

基于一种AI辅助可穿戴微流控比色传感器系统

存在的挑战限制了这项技术的实际应用。据麦姆斯咨询报道，为了克服这些挑战，来自中国石油大学（华东）的研究人员开发了一种人工智能（AI）辅助的可穿戴微流控比色传感器

发表于 06-29 10:57 •1.1w次阅读

研究人员利用人工智能提升超透镜相机的图像质量

透镜相机的图像质量。这种新方法利用人工智能将低质量图像转化为高质量图像，从而使这些相机可以用于多种成像任务，包括复杂的显微镜应用和移动设备。超透镜是一种超薄光学器件，通常只有几毫米厚--利用纳米结构来操纵光线。虽然它们的小尺寸

发表于 06-11 06:34 •439次阅读

MIT/三星研究人员利用活体拉曼光谱直接观察葡萄糖指纹图谱

麻省理工学院(MIT，Cambridge, MA, USA)和三星(Samsung, Korea)的研究人员最近在《Science Advances》杂志上发表的一篇论文展示了拉曼光谱法用于

发表于 06-05 06:35 •421次阅读

一种可实现稳定压力传感的新型可拉伸电子皮肤

现有的电子皮肤会随材料拉伸而降低传感精度。美国得克萨斯大学奥斯汀分校研究人员开发出一种新型可拉伸电子皮肤，解决了这项新兴技术的一个主要难题。

发表于 05-09 09:07 •559次阅读

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》2.0

、自然语言处理感兴趣的研究人员、工程师以及学生阅读。无论是初学者还是有一定基础的专业人士，都能从中获得有价值的信息。

发表于 05-07 10:30

研究人员利用定制光控制二维材料的量子特性

的发展铺平了道路。由美国能源部SLAC国家加速器实验室和斯坦福大学研究人员领导的研究小组将这种方法应用于一种名为六方氮化硼(hBN)的材料，这种材料由单层原子以蜂窝状排列而成，其特性

发表于 05-06 06:29 •312次阅读

研究人员开发出高性能p型非晶氧化物半导体

和 107 的开/关电流比，与早期 n 型氧化物薄膜晶体管的关键电气属性非常相似。此外，薄膜晶体管在长时间偏置应力下表现出显著的稳定性以及大面积薄膜的均匀性。图源：浦项工科大学 研究人员合作开发了碲硒复合氧化物半导体材料。他们成功创造了高性能和高稳定性的p型薄膜晶体管（

发表于 04-30 14:58 •622次阅读

一种用于化学和生物材料识别的便携式拉曼光谱解决方案

基于扫频光源的紧凑型拉曼光谱系统：美国麻省理工学院（MIT）和韩国科学技术院（KAIST）的研究人员开发了一种

发表于 04-16 10:35 •609次阅读

印度开发出一种用于显示器和传感器的可调谐彩色薄膜

据麦姆斯咨询报道，近日，印度科学研究所（Indian Institute of Science，简称“IISc”）的研究团队开发出一种柔性可调谐彩色薄膜，该薄膜不需要任何颜料，仅凭其物

发表于 04-10 09:06 •614次阅读

一种基于单像素光电探测器的高光谱视频成像系统设计

日前，北京理工大学光电学院王涌天教授、刘越教授团队成员徐怡博教授与来自谷歌公司和美国莱斯大学研究人员合作，开发了一种具有优异压缩比和吞吐量的基于单像素光电探测器的高光谱视频成像系统

发表于 03-15 09:40 •934次阅读