0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能体如何应对训练中故意碰瓷儿的“弱”对手呢?

倩倩 来源:大数据文摘 2020-01-02 15:50 次阅读

人们通常会派出最强大的选手和场景训练人工智能,但是,智能体如何应对训练中故意碰瓷儿的“弱”对手呢?

来看看下边的两个场景:两个AI智能体正在“训练场“进行一场激烈的足球赛,一个守门、一个射门。当守门员忽然自己摔倒,攻方没有选择乘胜追击,也忽然不知所措了起来。

在相扑的规则下也一样,当其中一个队员开始不按套路出牌时,另一个对手也乱作一团,双方立刻开始毫无规则扭打在一起。

这样“人工智障”的场景可不是随意配置的游戏,而是一项对AI对抗训练的研究。

我们知道,通常情况下,智能体都是通过相互对抗来训练的,无论是下围棋的阿法狗还是玩星际争霸的AlphaStar,都是通过海量的对局来训练自己的模型,从而探索出获胜之道。

但是试想一下,如果给阿法狗的训练数据都是围棋小白乱下的对局,给AlphaStar提供的是小学生局,结果会是如何?

近期,来自伯克利的研究人员就进行了这样的实验。红色机器人与已经是专家级别的蓝色机器人进行对抗训练,红色机器人采取一定的对抗策略攻击蓝色机器人进行的深度学习。这项研究的论文作者也在NIPS大会上对该研究进行了展示。

论文链接:

https://arxiv.org/pdf/1905.10615.pdf

在实验中,红色机器人为了不让蓝色机器人继续从对抗中学习,没有按照应有的方式玩游戏,而是开始“乱舞”起来,结果,蓝色机器人开始玩得很糟糕,像喝醉了的海盗一样来回摇晃,输掉的游戏数量是正常情况下的两倍。

研究发现,在采取对抗性政策的对局中,获胜不是努力成为一般意义上的强者,而是采取迷惑对手的行动。研究人员通过对对手行为的定性观察来验证这一点,并发现当被欺骗的AI在对对手视而不见时,其表现会有所改善。

我们都知道,让人工智能变得更聪明的一个方法是让它从环境中学习,例如,未来的自动驾驶可能比人类更善于识别街道标志和避开行人,因为它们可以通过海量的视频获得更多的经验。

但是如果有人利用这一方式进行研究中所示的“对抗性攻击” ——通过巧妙而精确地修改图像,那么你就可以愚弄人工智能,让它对图像产生错误的理解。例如,在一个停车标志上贴上几个贴纸可能被视为限速标志,同时这项新的研究也表明,人工智能不仅会被愚弄,看到不该看到的东西,还会以不该看到的方式行事。

这给基于深度学习的人工智能应用敲响了一个警钟,这种对抗性的攻击可能会给自动驾驶、金融交易或产品推荐系统带来现实问题。

论文指出,在这些安全关键型的系统中,像这样的攻击最受关注,标准做法是验证模型,然后冻结它,以确保部署的模型不会因再训练而产生任何新问题。

因此,这项研究中的攻击行为也真实地反映了在现实环境中,例如在自动驾驶车辆中看到的深度学习训练策略,此外,即使被攻击目标使用持续学习,也会有针对固定攻击目标进行训练的策略,攻击者可以对目标使用模拟学习来生成攻击模型。

或者,在自动驾驶车辆,攻击者可以通过购买系统的副本并定期在工厂重置它,一旦针对目标训练出了敌对策略,攻击者就可以将此策略传输到目标,并利用它直到攻击成功为止。

研究也对今后的工作提出了一些方向:深度学习策略容易受到攻击,这突出了有效防御的必要性,因此在系统激活时可以使用密度模型检测到可能的对抗性攻击,在这种情况下,还可以及时退回到保守策略。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28607

    浏览量

    207884
  • 智能体
    +关注

    关注

    1

    文章

    163

    浏览量

    10603
  • 深度学习
    +关注

    关注

    73

    文章

    5511

    浏览量

    121389
收藏 人收藏

    评论

    相关推荐

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    和经验积累,使机器人能够自主发现工艺规律,优化作业参数。家庭服务机器人则采用混合任务规划策略:将预训练的基础技能与实时规划相结合,灵活应对开放环境的各种情况。 第9章深入探讨了元学习在具身
    发表于 12-24 15:03

    介电容器失效模式分析方法

    介电容器作为电子元件的重要组成部分,其失效模式分析对于保障电子设备的可靠性和稳定性具有重要意义。 一、引言 介电容器,即陶瓷介质电容器,因其高频特性好、温度系数小、耐高压等优点,在电子电路
    的头像 发表于 09-20 15:35 639次阅读

    介电容器在性能上有哪些主要优缺点

    介电容器是一种使用陶瓷材料作为介质的电容器,广泛应用于电子电路,用于储存和释放电能、滤波、去耦、谐振等。由于陶瓷材料的介电常数较高,介电容器通常具有较小的体积和较高的电容值。然而,它们也有一些
    的头像 发表于 09-20 15:25 642次阅读

    华岭申正式竣工投产!

    华岭股份全资子公司—上海华岭申集成电路有限责任公司(以下简称:华岭申)在上海临港举行开业仪式。上海自由贸易试验区临港新片区管委会高科处副处长吴海涛、临港集团副总经济师、临港科投公司董事长翁巍、临
    的头像 发表于 08-20 16:54 735次阅读

    电磁干扰训练系统原理是什么

    智慧华盛恒辉电磁干扰训练系统的原理主要基于电磁干扰(EMI)的基本原理,即利用电磁波对电子设备或系统产生的干扰,通过模拟真实的电磁环境,对受训人员进行电磁干扰应对能力的训练。以下是电磁干扰训练
    的头像 发表于 07-22 16:34 408次阅读

    海上电磁干扰训练系统

    智慧华盛恒辉海上电磁干扰训练系统是一种专门用于模拟海上电磁环境、训练人员应对电磁干扰能力的系统。以下是对海上电磁干扰训练系统的详细解析: 智慧华盛恒辉系统概述 智慧华盛恒辉海上电磁干扰
    的头像 发表于 07-15 16:05 293次阅读

    工业一机在智能分拣的应用

    工业一机在智能分拣系统的应用是物流行业自动化和智能化升级的重要组成部分。这些设备通常具备高性能计算能力、稳定性和耐用性,能够在复杂和苛刻的工业环境
    的头像 发表于 07-15 15:25 366次阅读
    工业一<b class='flag-5'>体</b>机在<b class='flag-5'>智能</b>分拣<b class='flag-5'>中</b>的应用

    其利天下技术·无刷电机磁控制是什么?有什么好处·BLDC驱动方案

    作为一个无刷电机驱动方案开发商,我们在开发产品的时候就会用到“磁控制技术”。比如,我们开发的吸尘器方案时就会用到。什么是磁控制技术,它又有什么优势?其利天下技术无刷电机驱动方案开发
    的头像 发表于 06-07 18:42 1226次阅读
    其利天下技术·无刷电机<b class='flag-5'>弱</b>磁控制是什么?有什么好处·BLDC驱动方案

    什么是电机的磁?电机磁的可能原因有哪些?

    在电机运行的过程,我们有时会遇到电机磁的情况。电机磁,简而言之,即电机在运行时输出功率下降,不足以满足正常使用需求的现象。这一现象可能由多种原因引起,对电机的性能和运行稳定性产生不良影响。本文将详细探讨电机的
    的头像 发表于 06-04 16:15 4668次阅读

    遇到液晶拼接屏幕左右黑屏的问题应该怎样应对

    如今放眼望与商显市场,液晶拼接屏现在已广泛的被应用于各个行业领域。在液晶拼接屏被广泛应用的同时,用户对液晶拼接屏的“五脏”并不了解,不管液晶拼接屏的性能有多么的稳定,但是日常中小故障也是难免会有的,比如,液晶拼接屏左右黑屏的现象就是问题常见之一。如果遇到此种问题,用户应该怎样
    的头像 发表于 06-04 14:37 684次阅读
    遇到液晶拼接屏幕左右黑屏的问题应该怎样<b class='flag-5'>应对</b><b class='flag-5'>呢</b>?

    大模型不够用,还有“AI智能”?

    模型,为什么还需要发展AI智能?这还需要从AI智能是什么讲起。#01-AI智能
    的头像 发表于 05-12 08:04 344次阅读
    大模型不够用,还有“AI<b class='flag-5'>智能</b><b class='flag-5'>体</b>”?

    管电阻器的作用 使用管电阻器的注意事项

    管电阻器的作用 使用管电阻器的注意事项  管电阻器是一种常见的电器元件,用于限制电流、测量电流和调节电压等功能。它由管和内部的电阻
    的头像 发表于 03-05 16:30 1660次阅读

    知语云智能科技无人机防御系统:应对新兴威胁的先锋力量

    随着科技的飞速发展,无人机技术在各个领域的应用日益广泛,但随之而来的是无人机威胁的不断升级。为了有效应对这些新兴威胁,知语云智能科技推出了先进的无人机防御系统,为空中安全保驾护航。 无人机防御系统
    发表于 02-26 16:35

    高频介电容与涤纶电容、低频介电容的区别

    等方面存在一些显著的差异。 首先,我们来看高频介电容。高频介电容以陶瓷材料为基础,广泛应用于高频电路,如无线通信系统、射频放大器等。它具有以下几个特点: 1. 高频特性:高频
    的头像 发表于 02-02 15:54 1923次阅读

    如何判断超高压介电容的好坏

    如何判断超高压介电容的好坏  超高压介电容器是一种常见的电力设备,用于电力系统的电能传输和维护电网稳定性。因此,判断超高压介电容器的好坏对确保电力系统的安全和稳定至关重要。本文
    的头像 发表于 02-02 15:43 1025次阅读