0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员开发了一种工具用于训练人工智能系统的图像集中的潜在偏差

倩倩 来源:新经网 作者:新经网 2020-10-15 14:41 次阅读

普林斯顿大学的研究人员开发了一种工具,用于标记用于训练人工智能AI)系统的图像集中的潜在偏差。这项工作是纠正和防止AI系统中普遍存在的偏见的一项较大努力的一部分,该偏见影响了从信贷服务到法庭判决程序的所有内容。

尽管AI系统中偏见的来源多种多样,但一个主要的原因是从在线资源收集的大量图像中包含的定型图像,工程师使用这些图像来开发计算机视觉,这是AI的一个分支,允许计算机识别人,物体和动作。由于计算机视觉的基础是建立在这些数据集上的,因此反映社会定型观念和偏见的图像会无意间影响计算机视觉模型。

为了从源头上解决这个问题,普林斯顿视觉AI实验室的研究人员开发了一种开源工具,该工具可以自动发现视觉数据集中的潜在偏差。该工具允许数据集创建者和用户在使用图像收集来训练计算机视觉模型之前纠正代表性不足或刻板印象的问题。在相关工作中,Visual AI Lab的成员发布了现有方法的比较,这些方法可防止计算机视觉模型本身出现偏差,并提出了一种新的,更有效的缓解偏差的方法。

第一个工具称为REVISE(揭示视觉偏见),它使用统计方法来检查数据集的三个方面:基于对象,基于性别和基于地理位置的潜在偏见或代表性不足。REVISE是一种全自动工具,建立在早期工作的基础上,涉及以需要用户更多指导的方式来过滤和平衡数据集的图像。该研究报告于8月24日在虚拟的欧洲计算机视觉会议上发表。

REVISE使用现有的图像注释和度量来评估数据集的内容,例如对象计数,对象和人的共现以及图像的原产国。在这些测量中,该工具可显示不同于中值分布的图案。

例如,在一个测试的数据集中,REVISE显示,包括人和花朵在内的图像在雄性和雌性之间是不同的:雄性更经常出现在仪式或会议上,并带有花朵,而雌性则倾向于出现在舞台上或绘画中。(分析仅限于反映图像中出现的人的二元性别的注释。)

一旦该工具揭示了这些差异,“那么,这就是一个完全无害的事实,或者是否正在发生更深层的事情,而这很难自动化,”计算机科学与专业副教授奥尔加·鲁萨科夫斯基(Olga Russakovsky)说。视觉AI实验室的调查员。Russakovsky与研究生Angelina Wang和计算机科学副教授Arvind Narayanan共同撰写了该论文。

例如,REVISE显示,包括飞机,床和比萨饼在内的物体在包含它们的图像中比在其中一个数据集中的典型物体更大。这样的问题可能不会永久保留社会定型观念,但是对于训练计算机视觉模型可能会出现问题。作为补救措施,研究人员建议收集飞机图像,其中还包括山峰,沙漠或天空标签

但是,计算机视觉数据集中全球区域的代表性不足,可能会导致AI算法出现偏差。与以前的分析一致,研究人员发现,对于图像的来源国(按人口标准化),美国和欧洲国家在数据集中的代表过多。除此之外,REVISE还显示,对于来自世界其他地区的图像,图像标题通常不是使用本地语言,这表明其中许多图像是被游客捕获的,并可能导致某个国家/地区的视角偏斜。

Russakovsky说,专注于对象检测的研究人员可能会忽略计算机视觉的公平性问题。她说:“但是,这种地理分析表明,物体识别仍然可能存在很大的偏见和排他性,并且会不平等地影响不同的地区和人民。”

共同作者,计算机科学研究生安吉丽娜·王说:“直到最近,才对计算机科学中的数据集收集实践进行彻底的审查。”她说,图片大多是“从互联网上抓取的,人们并不总是意识到他们的图片在[数据集中]被使用。我们应该从更多的人群中收集图片,但是当我们这样做时,我们应该小心我们以尊重的方式获得图像。”

“工具和基准测试是重要的一步……它们使我们能够在开发初期就抓住这些偏见,并重新考虑我们的问题设置和假设以及数据收集实践,”计算机科学助理教授Vicente Ordonez-Roman说。未参与研究的弗吉尼亚大学。“在计算机视觉中,有关刻板印象的表示和传播存在一些特定的挑战。诸如普林斯顿视觉AI实验室所做的工作有助于阐明这些问题并引起计算机视觉界的注意,并提供了缓解这些问题的策略。 ”

视觉AI实验室的一项相关研究对防止计算机视觉模型学习可能反映偏差的虚假关联进行了研究,这些虚假关联可能会反映偏差,例如过度预测活动(例如以女性形象烹饪或以男性形象进行计算机编程)。视觉提示(例如,斑马是黑白的,或者篮球运动员经常穿着球衣)有助于提高模型的准确性,因此在开发有效模型的同时避免出现问题性关联是该领域的重大挑战。

在6月举行的虚拟计算机视觉和模式识别国际国际会议上提出的研究中,电气工程专业的研究生Zeyu Wang及其同事比较了四种缓解计算机视觉模型偏差的技术。

他们发现一种称为对抗训练或“盲目的公平”的流行技术损害了图像识别模型的整体性能。在对抗训练中,模型无法考虑有关受保护变量的信息-在研究中,研究人员使用性别作为测试案例。在团队的分析中,另一种方法称为域独立培训,即“通过意识进行公平”,效果更好。

鲁萨科夫斯基说:“从本质上讲,这意味着我们将针对不同性别进行不同的活动频率,是的,这一预测将取决于性别。因此,我们只是接受这一观点。”

本文中概述的技术通过与其他视觉提示分开考虑受保护的属性来减轻潜在的偏见。

王泽宇说:“我们如何真正解决偏差问题是一个更深层次的问题,因为我们当然可以看到它存在于数据本身中。”他说:“但是在现实世界中,人们仍然可以在意识到我们的偏见的同时做出良好的判断”,并且可以设置计算机视觉模型以类似的方式工作。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1083

    浏览量

    40410
  • 人工智能
    +关注

    关注

    1791

    文章

    46838

    浏览量

    237507
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24639
收藏 人收藏

    评论

    相关推荐

    嵌入式和人工智能究竟是什么关系?

    嵌入式和人工智能究竟是什么关系? 嵌入式系统一种特殊的系统,它通常被嵌入到其他设备或机器中,以实现特定功能。嵌入式系统具有非常强的适应性
    发表于 11-14 16:39

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    阅读这章后,我深感人工智能与生命科学的结合正引领着场前所未有的科学革命,以下是我个人的读后感: 1. 技术革新与生命科学进步 这章详细阐述了
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    非常高兴本周末收到本新书,也非常感谢平台提供阅读机会。 这是本挺好的书,包装精美,内容详实,干活满满。 关于《AI for Science:人工智能驱动科学创新》第二章“AI
    发表于 10-14 09:16

    《AI for Science:人工智能驱动科学创新》第人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    人工智能推荐系统中强大的图形处理器(GPU)争高下。其独特的设计使得该处理器在功耗受限的条件下仍能实现高性能的图像处理任务。 Ceremorphic公司 :该公司
    发表于 09-28 11:00

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟按照要求准备相关体会材料。看能否有助于入门和
    发表于 09-09 15:36

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    材料基因组工程的推动下,人工智能如何与材料科学结合,加快传统材料和新型材料的开发过程。 第4章介绍了人工智能在加快药物研发、辅助基因研究方面及在合成生物学中的普遍应用。 第5章介绍了
    发表于 09-09 13:54

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 、深度学习加速 训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和
    发表于 07-29 17:05

    Whatsapp正在开发一种新的生成人工智能功能

    据悉,Whatsapp正在开发一种新的生成人工智能功能,该功能应允许用户制作自己的个性化头像,用于任何想象中的场景。WABetaInfo在新的Android版WhatsApp测试版2.
    的头像 发表于 07-14 17:50 947次阅读

    日本九州大学开发了名为QDyeFinder的人工智能(AI)工具

    QDyeFinder的人工智能(AI)工具,这创新技术能够在小鼠大脑的图像中自动识别和重建单个神经元的复杂结构,为神经科学研究开启了新的篇
    的头像 发表于 07-03 14:43 433次阅读

    研究人员提出一种电磁微镜驱动系统

    领域。MEMS微镜作为一种微光机电系统(MOEMS),已广泛应用于医疗、汽车、消费和军事电子等众多领域。当前,业界对具有广阔前景的小型激光雷达的需求不断增长。之前,已有研究
    的头像 发表于 07-02 17:04 1.1w次阅读

    基于一种AI辅助可穿戴微流控比色传感器系统

    存在的挑战限制了这项技术的实际应用。 据麦姆斯咨询报道,为了克服这些挑战,来自中国石油大学(华东)的研究人员开发了一种人工智能(AI)辅助的可穿戴微流控比色传感器
    的头像 发表于 06-29 10:57 1w次阅读
    基于<b class='flag-5'>一种</b>AI辅助可穿戴微流控比色传感器<b class='flag-5'>系统</b>

    研究人员利用人工智能提升超透镜相机的图像质量

    透镜相机的图像质量。这种新方法利用人工智能将低质量图像转化为高质量图像,从而使这些相机可以用于多种成像任务,包括复杂的显微镜应用和移动设备。
    的头像 发表于 06-11 06:34 333次阅读
    <b class='flag-5'>研究人员</b>利用<b class='flag-5'>人工智能</b>提升超透镜相机的<b class='flag-5'>图像</b>质量

    嵌入式人工智能的就业方向有哪些?

    联网ARM开发 NB-IoT开发及实战 七:python工程师,人工智能工程师 python语法基础 python核心编程 基于OpenCV的机器视觉开发 嵌入式
    发表于 02-26 10:17

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    训练是MetaAI研究人员认为的一种降低模型使用成本的方式。为了更好的效果,即便是LLaMA最小的70亿参数的版本,其训练使用的tokens数量也有1万亿个(1 trillion to
    发表于 12-22 10:18