0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能在模仿人类的道路上学到了偷懒

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-06-15 15:41 次阅读

人工智能在模仿人类的道路上,Get 到了一项精髓 —— 偷懒。

2018 年 4 月,OpenAI 公司举办了首届针对 AI 的强化学习竞赛。这场比赛让 AI 们来玩 NES 平台上的《刺猬索尼克》单机游戏。举办方希望 AI 能够在学习游戏技巧之后,能够拥有在其他地图上自觉找到最佳通关方法的能力,以此来评估强化算法的泛化能力。

结果 AI 好像对游戏有着一套自己的理解,它们绕过研究员预期的目标和设定,通过不断 “卡 Bug” 的方式找到了通关的 “捷径”。

谷歌 DeepMind AI 项目的研究人员维多利亚・克拉科夫纳(Victoria Krakovna)在其他游戏中也发现了这种现象。在《海岸赛艇》里,AI 操纵的船只为了获得更高分数,不断利用 Bug 来撞击奖励而忘了要抵达终点。甚至在玩《俄罗斯方块》这种小游戏时,AI 也找到了终极密码:只要游戏暂停就永不会输……

在最后,OpenAI 的强化学习竞赛虽然没有认可 “走捷径” 获胜的 AI,但研究人员还是认为:“AI 展示了它如何在没有人类介入的情况下赢得游戏胜利,出乎意料并极富有创造性,这可能完全颠覆人类对游戏如何运行的理解。”

AI 是如何学会走捷径的?

针对这一现象,北京大学王选计算机研究所和北京大学计算语言学教育部重点实验室的研究团队在 arXiv 上发表了研究论文《为什么机器阅读理解模型学会走捷径》 (Why Machine Reading Comprehension Models Learn Shortcuts)。

机器阅读理解(Machine Reading Comprehension, MRC)为自然语言处理(NLP)的核心任务之一,也是评价模型理解文本能力的重要指标,可以将其视为一种句子关系匹配任务。通常任务是让机器阅读给定的一篇文章并回答关于该文章的一个问题。其常见任务形式有四种:完形填空、多想选择、片段抽取和自由作答。

完形填空即将文章中的某些单词隐去,让模型根据上下文判断被隐去的单词最可能是哪个;多项选择是指让模型从多个备选答案中选择一个最有可能是正确答案的选项;片段抽取是让模型从文章中抽取连续的单词序列;自由作答则是让模型自主生成一个单词序列,使之作为问题的答案,与片段抽取任务不同,自由作答的序列并不局限于文章中给定的句子。

论文中提到,许多 MRC 模型绕过了常规的推理路径,通过 “走捷径” 给出了出人意料的答案。但这些答案往往无法真正解决问题,无法帮助人类达到预期目标。为了解决这一问题,该团队将关注点聚焦在为什么这些算法模型学会了 “走捷径”。

研究者认为,训练数据库中的大量 “捷径” 问题是导致模型过渡依赖 “偷懒行为” 的 “罪魁祸首”。

北大研究者设计了一个经过标注的全新数据集,在这个数据集中,每个问题都会有 “捷径式” 和 “挑战式” 两个版本的答案。他们还进一步提出了两种新的研究方法来量化分析在 “捷径模式” 和 “挑战模式” 下学习的难易程度,并试图揭示在这两种不同模式下的固有学习机制。

研究人员将能够 “释义”( Paraphrasing )作为更为复杂和高级的答案标准,将那些只有关键字提取而没有任何上下文理解和推理的答案定义为 “捷径” 版答案。

研究人员发现,在训练数据集中高占比的 “捷径模式” 数据使得模型更加依赖 “偷懒”,致使其之后的训练中无法提升更为复杂的推理技巧,阻碍了模型去学习 “释义” 过程由此解决更具挑战性的问题。文章表明,如果训练集中 “挑战版” 问题足够多的话,算法模型不但能吸收 “挑战版” 问题,同时还能正确回答 “捷径版” 的问题。

论文表示,在早期阶段,模型通常会用最简单的方法来拟合训练数据。“走捷径” 所消耗的资源最少,因此这种路径会成为优先选项。当模型发现 “偷懒” 可以解决大部分问题时,其余问题便无法再激励 AI 去探索更为复杂的解决方法。

研究者认为,导致 AI 习惯性偷懒的原因,除了 NLP 架构的设计问题之外,也有可能是训练过程中标准优化和资源保护的结果,此外,让 AI 在有限时间内迅速输出答案也会使给其造成 “压力”。

因此,人们可以通过修改 NLP 架构,让 AI 优先考虑更具挑战的数据和问题,并且再数据预处理领域也需要将数据中的 “捷径” 考虑进去。

原文标题:AI竟也学会偷懒?北大团队:数据集“走捷径”问题占比太高

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30848

    浏览量

    269003
  • 人工智能
    +关注

    关注

    1791

    文章

    47256

    浏览量

    238409

原文标题:AI竟也学会偷懒?北大团队:数据集“走捷径”问题占比太高

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    嵌入式和人工智能究竟是什么关系?

    领域,如工业控制、智能家居、医疗设备等。 人工智能是计算机科学的一个分支,它研究如何使计算机具备像人类一样思考、学习、推理和决策的能力。人工智能的发展历程可以追溯到上世纪50年代,经
    发表于 11-14 16:39

    人工智能在智慧城市建设中的应用

    传感器和智能控制算法实时收集和分析交通数据,实现智能信号控制,提高道路通行效率。 无人驾驶技术 结合智能车辆和无人驾驶技术,人工智能可以实时
    的头像 发表于 10-24 16:15 1148次阅读

    人工智能人类的影响有哪些

    人工智能(AI)作为现代科技的杰出代表,正在以前所未有的速度改变着人类的生活、工作和社会结构。这种影响是全方位的,既带来了显著的积极变化,也伴随着一系列挑战和问题。 一、积极影响 工作变革与经济增长
    的头像 发表于 10-22 17:23 1796次阅读

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得一好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这一章详细
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    农业、环保等,为人类社会的可持续发展做出贡献。 总结 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们展示了一个充满希望和机遇的未来。在这个未来中,人工智能
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    ,无疑为读者铺设了一条探索人工智能(AI)如何深刻影响并推动科学创新的道路。在阅读这一章后,我深刻感受到了人工智能技术在科学领域的广泛应用潜力以及其带来的革命性变化,以下是我个人的学习
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    RISC-V在人工智能图像处理领域的应用前景十分广阔,这主要得益于其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析: 一、RISC-V的基本特点 RISC-V
    发表于 09-28 11:00

    光庭信息在人工智能领域的最新成就

    光庭信息成功举办了AI DAY嘉年华,其间首次发布了最新研发的汽车软件研发和管理智能平台——Aily。此次活动不仅彰显了光庭在人工智能领域的最新成就,也标志着公司在汽车软件开发智能道路上
    的头像 发表于 09-20 10:16 509次阅读

    生成式人工智能在教育中的应用

    生成式人工智能在教育中的应用日益广泛,为教育领域带来了诸多变革和创新。以下是对生成式人工智能在教育中的几个主要应用方面的详细阐述:
    的头像 发表于 09-16 16:07 1025次阅读

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟按照要求准备相关体会材料。看能否有助于入门和提高ss
    发表于 09-09 15:36

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    材料基因组工程的推动下,人工智能如何与材料科学结合,加快传统材料和新型材料的开发过程。 第4章介绍了人工智能在加快药物研发、辅助基因研究方面及在合成生物学中的普遍应用。 第5章介绍了人工智能如何在提高
    发表于 09-09 13:54

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    ,得到了华为、腾讯、优必选、中煤科工、中国联通、云天励飞、考拉悠然、智航、力维智联等国内人工智能企业的深度参与和大力支持。 报名后即可到现场领取礼品,总计5000份,先到先选! 点击报名:https://bbs.elecfans.com/jishu_2447254_1
    发表于 08-22 15:00

    AI人工智能在新能源领域的创新应用

    AI人工智能在新能源领域的应用不仅推动了技术的创新和发展,还促进了整个汽车产业的绿色转型和可持续发展。未来,随着技术的不断进步和应用的深化,AI将在新能源领域发挥更加重要的作用,为人类社会创造更加美好的明天。
    的头像 发表于 07-21 09:50 839次阅读

    人工智能在军事方面的应用

    智慧华盛恒辉人工智能在军事方面的应用广泛且深入,主要包括以下几个方面: 智慧华盛恒辉一、作战效能提升 自动目标识别与跟踪: 人工智能系统能够在复杂环境中准确识别和跟踪目标,提高作战效率。利用图像识别
    的头像 发表于 07-16 09:52 586次阅读

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能领域布局
    发表于 02-26 10:17