0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Open Images Extended合集中引入了更具包容性的人物注释MIAP数据集

硬件三人行 来源:TensorFlow 作者:TensorFlow 2021-08-16 17:20 次阅读

发布人:Google Research 软件工程师 Candice Schumann 和 Susanna Ricco

2016 年,我们推出了 Open Images。此协作版本包含约 900 万张含有标签的图像,涵盖数千个对象类别和 600 个类的边界框注释。从那之后,我们进行了多次更新,如将众包数据发布到 Open Images Extended 合集,以此提高对象注释的多样性。

更新

https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html

Open Images Extended

https://storage.googleapis.com/openimages/web/extended.html

虽然这些数据集提供的标签扩展性很强,但此类标签并没有关注人物的敏感属性,这些属性对于许多机器学习 (ML) 公平性任务(例如公平性评估和偏见缓解)至关重要。事实上,找到包含彻底标记此类敏感属性的数据集是很困难的,尤其是在计算机视觉领域。

公平性任务

https://developers.google.com/machine-learning/crash-course/fairness/video-lecture

今天,我们在 Open Images Extended 合集中引入了更具包容性的人物注释 (MIAP) 数据集。此合集包含更多完整的边界框注释,用于包含 10 万张人物图像中的的人物类层级结构。每个注释还带有可感知到的性别呈现和年龄范围等公平相关属性的标签。作为 Responsible AI 研究的一部分,越来越多的人开始关注如何减少不公平偏见,我们希望这些注释能够激励已经在使用 Open Images 的研究者,将公平分析纳入他们的研究中。

Responsible AI 研究

https://ai.google/principles/

交叉描述通过为现有图像-描述对和辅助描述添加语义相似度人工评分来扩展 MS-COCO 评估集(实线),并通过为新的图像-描述、描述-描述和图像-图像对添加人工评分来提高评分密度(虚线)*

Open Images 中的注释

原始 Open Images 数据集中的每个图像都包含图像级注释(宽泛地描述图像)和包围特定对象的边界框。为了避免对同一个对象绘制多个边界框,我们从标签候选集中临时删减了具体性较弱的类,我们将这一过程称为层级去重。举个例子,若一个图像的标签包括动物、 猫,和洗衣机则该图像的注释边界框为猫和洗衣机,而不会注释多余的类 ——动物。

图像级注释

https://cloud.google.com/vision/docs/labels

边界框

https://cloud.google.com/vision/docs/object-localizer

MIAP 数据集可用于原始 Open Images 数据,集中人物 层级包含的五个类:人物、男人、女人、男孩、女孩。由于这些标签的存在,Open Images 数据集对于推进 Responsible AI 的研究具有独特的价值,能够帮助开发者训练通用的人物检测器,访问性别和年龄范围特定的标签,以实现公平分析和偏见缓解。

Responsible AI

https://ai.google/responsibilities/responsible-ai-practices/

人物检测器

https://cloud.google.com/video-intelligence/docs/people-detection

然而,我们发现结合了层级去重和女人/女孩与男人/男孩之间的社会性区别后,原始注释会受到限制。举个例子,如果要求注释器针对女孩这一分类绘制边界框,它们便不会在图像中的男孩周围绘制边界框。注释器可能会也可能不会在某位女性周围绘制边界框,这取决于其对个人年龄的评估以及对女孩这一概念的文化性理解。此类判断在不同图像中可能会存在不一致,这取决于单独的注释器的文化背景、图像人物的外表和场景的上下文。因此,某些图像中的边界框注释会不完整,一些较为显眼的人物没有得到注释。

MIAP 中的注释

新的 MIAP 注释旨在解决这些限制,实现让 Open Images 成为推动机器学习公平性研究取得新进展的数据集的保障。我们不要求注释器为层级结构中最具体的类(例如,女孩)绘制边界框,而是将此程序反过来,要求它们为性别和年龄未知的人物分类绘制边界框。

所有人物边界框届时都将获得感知到的性别呈现(很大可能是女性、很大可能是男性,或未知)以及年龄呈现(青年、中年、老年,或未知)等标签。我们认识到性别不是二元的,个人的性别认同可能与其感知或预期的性别呈现不符,为了缓解无意识偏见对注释的影响,这里提示:注释器,与性别呈现相关的规范因文化而异,且会随时间的推移而变化。

这个过程添加了大量先前丢失的边界框。

在包含人物的 10 万张图像中,人物边界框的数量从 35.8 万左右增加到 45.4 万左右。各个感知性别呈现和感知年龄呈现的边界框数量持续增加。这些新注释为人物检测器的训练提供了更完整的基本事实,并提供了更准确的子组标签,以将公平性纳入计算机视觉研究。

预期用例

我们为人物边界框的感知年龄范围和性别呈现纳入了注释,因为我们认为有必要添加此类注释,以便提高能力,实现更好的理解以及努力缓解并消除图像理解领域,受保护子组之间的不公平偏见或不同性能。

我们注意到,标签捕获的性别和年龄范围是第三方仅根据视觉线索,而不是个人的自我认知性别或实际年龄评估出来的。我们不支持也不容忍构建或部署根据这些注释训练的性别或年龄呈现分类器,因为我们认为在公平性研究之外使用这些技术的相关风险大于任何潜在好处。

风险

https://dl.acm.org/doi/10.1145/3173574.3173582

致谢

这项研究背后的核心团队成员包括 Utsav Prabhu、Vittorio Ferrari 和 Caroline Pantofaru。同时,我们还要感谢 Alex Hanna、Reena Jana、Alina Kuznetsova、Matteo Malloci、Stefano Pellegrini、Jordi Pont-Tuset 和 Mahima Pushkarna 对本项目的贡献。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30095

    浏览量

    268363
  • 计算机视觉
    +关注

    关注

    8

    文章

    1696

    浏览量

    45925
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132397
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24637

原文标题:最新进展:将包容性人物注释纳入 Open Image Extended 数据集

文章出处:【微信号:yingjiansanrenxing,微信公众号:硬件三人行】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Cogent DataHub: 高效实现风电场数据集中管理与自动化

    某跨国电力公司利用宏Cogent DataHub软件集中管理美国西南部多个风电场的数据采集与控制,整合和实时传输OPC 服务器数据,提升了系统集成度,确保了
    的头像 发表于 11-07 10:20 124次阅读
    宏<b class='flag-5'>集</b>Cogent DataHub: 高效实现风电场<b class='flag-5'>数据</b><b class='flag-5'>集中</b>管理与自动化

    TIDP.SAA接口怎么实现I2C Read Extended功能?

    我想要支持I2C Read Extended功能,如上图所示,读出00FF数据,但是接口代码中的I2C_Read_Generic和 Read_Extended_Word并不能和TI的软件一样支持读出
    发表于 09-27 06:33

    求助,为什么噪声很小的信号通过一阶有源低通滤波器后反而引入了高频噪声?

    为什么噪声很小的信号通过一阶有源低通滤波器后反而引入了高频噪声?(信号从左边输入先经放大后再滤波,放大后的信号还是噪声非常小的)
    发表于 09-10 08:02

    PyTorch如何训练自己的数据

    PyTorch是一个广泛使用的深度学习框架,它以其灵活性、易用和强大的动态图特性而闻名。在训练深度学习模型时,数据是不可或缺的组成部分。然而,很多时候,我们可能需要使用自己的数据
    的头像 发表于 07-02 14:09 1309次阅读

    Harvard FairSeg:第一个用于医学分割的公平数据

    为了解决这些挑战,我们提出了第一个大规模医学分割领域的公平数据, Harvard-FairSeg。该数据旨在用于研究公平
    的头像 发表于 01-25 16:52 513次阅读
    Harvard FairSeg:第一个用于医学分割的公平<b class='flag-5'>性</b><b class='flag-5'>数据</b><b class='flag-5'>集</b>

    超级电容器在集中器中的应用

    单元)和下部多个终端或仪表。它负责管理整个系统、收集和存储所有数据以及管理上层和下层之间的通信通道。集中器在电力系统有着重要作用,所以自身的可靠也尤为重要,除了设备的本身质量以外,备用电源的选择也是
    发表于 01-15 16:51

    语音数据:探索、挑战与应用

    将探讨语音数据的重要、面临的挑战以及其在各个领域的应用。 一、语音数据的重要 语音
    的头像 发表于 12-28 13:56 511次阅读

    语音数据:推动智能语音技术发展的关键驱动力

    发展方向。 一、语音数据的重要 语音数据是智能语音技术的基石,它提供了大量的语音样本和对应的标签,用于训练和评估语音模型。通过语音
    的头像 发表于 12-28 13:46 511次阅读

    做项目没灵感?一起来看看Build2gether包容性创新挑战赛的创意吧!

    Build2gether包容性创新挑战赛近日,由欧洲顶级大学ETHZurich主办、全球知名硬件社区Hackster.io承办的Build2gether包容性创新挑战赛圆满结束。本次
    的头像 发表于 12-23 08:29 428次阅读
    做项目没灵感?一起来看看Build2gether<b class='flag-5'>包容性</b>创新挑战赛的创意吧!

    语音数据:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据则是AI语音技术的灵魂。本文将深入探讨语音数据的重要、构建方
    的头像 发表于 12-14 14:33 975次阅读

    大模型数据:力量的源泉,进步的阶梯

    的舞台 大模型数据如广袤的舞台,为AI技术的展现提供了广阔的空间。这些数据规模庞大,包容万象,它们是AI进步的基石。无论是自然语言处理、
    的头像 发表于 12-07 17:18 633次阅读

    如何规范嵌入式C编码注释以及排版与格式

    注释注释应放在其代码上方相邻位置或右方,不可放在下面。 ◎ 注释的内容要清楚明了,防止注释二义。 ◎ 修改代码时同步更新
    的头像 发表于 12-07 14:53 592次阅读

    zookeeper引入什么机制

    Zookeeper是一个开源的分布式协调服务,被广泛应用于构建分布式系统和大规模集群的管理。作为一个分布式协调服务,Zookeeper引入了一系列机制来提供可靠的协调和一致服务。在这篇文章中,我们
    的头像 发表于 12-03 16:38 802次阅读

    java怎么注释整个文档

    java中可以使用特殊的注释格式来注释整个文档,这种格式被称为JavaDoc注释。JavaDoc注释可以用于生成HTML格式的文档,包含类、方法、字段、参数等的详细说明。下面是
    的头像 发表于 11-28 17:14 685次阅读

    Java提供了哪些注释语句

    Java提供了很多种类型的注释语句,它们都有不同的用途和作用。在本文中,我们将详细介绍Java中的注释语句类型,并讨论它们的用法和如何正确使用它们。 单行注释(Single-line
    的头像 发表于 11-28 16:56 578次阅读