0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Open Images Extended合集中引入了更具包容性的人物注释MIAP数据集

硬件三人行 来源:TensorFlow 作者:TensorFlow 2021-08-16 17:20 次阅读

发布人:Google Research 软件工程师 Candice Schumann 和 Susanna Ricco

2016 年,我们推出了 Open Images。此协作版本包含约 900 万张含有标签的图像,涵盖数千个对象类别和 600 个类的边界框注释。从那之后,我们进行了多次更新,如将众包数据发布到 Open Images Extended 合集,以此提高对象注释的多样性。

更新

https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html

Open Images Extended

https://storage.googleapis.com/openimages/web/extended.html

虽然这些数据集提供的标签扩展性很强,但此类标签并没有关注人物的敏感属性,这些属性对于许多机器学习 (ML) 公平性任务(例如公平性评估和偏见缓解)至关重要。事实上,找到包含彻底标记此类敏感属性的数据集是很困难的,尤其是在计算机视觉领域。

公平性任务

https://developers.google.com/machine-learning/crash-course/fairness/video-lecture

今天,我们在 Open Images Extended 合集中引入了更具包容性的人物注释 (MIAP) 数据集。此合集包含更多完整的边界框注释,用于包含 10 万张人物图像中的的人物类层级结构。每个注释还带有可感知到的性别呈现和年龄范围等公平相关属性的标签。作为 Responsible AI 研究的一部分,越来越多的人开始关注如何减少不公平偏见,我们希望这些注释能够激励已经在使用 Open Images 的研究者,将公平分析纳入他们的研究中。

Responsible AI 研究

https://ai.google/principles/

交叉描述通过为现有图像-描述对和辅助描述添加语义相似度人工评分来扩展 MS-COCO 评估集(实线),并通过为新的图像-描述、描述-描述和图像-图像对添加人工评分来提高评分密度(虚线)*

Open Images 中的注释

原始 Open Images 数据集中的每个图像都包含图像级注释(宽泛地描述图像)和包围特定对象的边界框。为了避免对同一个对象绘制多个边界框,我们从标签候选集中临时删减了具体性较弱的类,我们将这一过程称为层级去重。举个例子,若一个图像的标签包括动物、 猫,和洗衣机则该图像的注释边界框为猫和洗衣机,而不会注释多余的类 ——动物。

图像级注释

https://cloud.google.com/vision/docs/labels

边界框

https://cloud.google.com/vision/docs/object-localizer

MIAP 数据集可用于原始 Open Images 数据,集中人物 层级包含的五个类:人物、男人、女人、男孩、女孩。由于这些标签的存在,Open Images 数据集对于推进 Responsible AI 的研究具有独特的价值,能够帮助开发者训练通用的人物检测器,访问性别和年龄范围特定的标签,以实现公平分析和偏见缓解。

Responsible AI

https://ai.google/responsibilities/responsible-ai-practices/

人物检测器

https://cloud.google.com/video-intelligence/docs/people-detection

然而,我们发现结合了层级去重和女人/女孩与男人/男孩之间的社会性区别后,原始注释会受到限制。举个例子,如果要求注释器针对女孩这一分类绘制边界框,它们便不会在图像中的男孩周围绘制边界框。注释器可能会也可能不会在某位女性周围绘制边界框,这取决于其对个人年龄的评估以及对女孩这一概念的文化性理解。此类判断在不同图像中可能会存在不一致,这取决于单独的注释器的文化背景、图像人物的外表和场景的上下文。因此,某些图像中的边界框注释会不完整,一些较为显眼的人物没有得到注释。

MIAP 中的注释

新的 MIAP 注释旨在解决这些限制,实现让 Open Images 成为推动机器学习公平性研究取得新进展的数据集的保障。我们不要求注释器为层级结构中最具体的类(例如,女孩)绘制边界框,而是将此程序反过来,要求它们为性别和年龄未知的人物分类绘制边界框。

所有人物边界框届时都将获得感知到的性别呈现(很大可能是女性、很大可能是男性,或未知)以及年龄呈现(青年、中年、老年,或未知)等标签。我们认识到性别不是二元的,个人的性别认同可能与其感知或预期的性别呈现不符,为了缓解无意识偏见对注释的影响,这里提示:注释器,与性别呈现相关的规范因文化而异,且会随时间的推移而变化。

这个过程添加了大量先前丢失的边界框。

在包含人物的 10 万张图像中,人物边界框的数量从 35.8 万左右增加到 45.4 万左右。各个感知性别呈现和感知年龄呈现的边界框数量持续增加。这些新注释为人物检测器的训练提供了更完整的基本事实,并提供了更准确的子组标签,以将公平性纳入计算机视觉研究。

预期用例

我们为人物边界框的感知年龄范围和性别呈现纳入了注释,因为我们认为有必要添加此类注释,以便提高能力,实现更好的理解以及努力缓解并消除图像理解领域,受保护子组之间的不公平偏见或不同性能。

我们注意到,标签捕获的性别和年龄范围是第三方仅根据视觉线索,而不是个人的自我认知性别或实际年龄评估出来的。我们不支持也不容忍构建或部署根据这些注释训练的性别或年龄呈现分类器,因为我们认为在公平性研究之外使用这些技术的相关风险大于任何潜在好处。

风险

https://dl.acm.org/doi/10.1145/3173574.3173582

致谢

这项研究背后的核心团队成员包括 Utsav Prabhu、Vittorio Ferrari 和 Caroline Pantofaru。同时,我们还要感谢 Alex Hanna、Reena Jana、Alina Kuznetsova、Matteo Malloci、Stefano Pellegrini、Jordi Pont-Tuset 和 Mahima Pushkarna 对本项目的贡献。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30947

    浏览量

    269220
  • 计算机视觉
    +关注

    关注

    8

    文章

    1698

    浏览量

    46005
  • 机器学习
    +关注

    关注

    66

    文章

    8420

    浏览量

    132690
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24714

原文标题:最新进展:将包容性人物注释纳入 Open Image Extended 数据集

文章出处:【微信号:yingjiansanrenxing,微信公众号:硬件三人行】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AMC1200BDUBR在工作时引入了112MHz和132MHz的EMC噪声,怎么消除?

    请问前辈,我用的TI芯片:AMC1200BDUBR 在工作时引入了112MHz和132MHz的EMC 噪声。请问电路要怎么改进才能消除这个噪声?望前辈能帮忙推荐解决方法 不胜感激!
    发表于 12-23 07:31

    沙特阿拉伯发布《利雅得宣言》 共筑包容性、创新和有影响力的人工智能未来

    政府、私营部门、非营利部门、企业家与创新者在数字领域的国际合作。 沙特通信与信息技术大臣阿卜杜拉•斯瓦哈(H.E. Abdullah Alswaha) 表示,《利雅得宣言》得到了沙特王储兼首相的支持与授权。《利雅得宣言》重点聚焦于人工智能的包容性、创新和影响力。
    的头像 发表于 12-18 09:56 151次阅读

    Cogent DataHub: 高效实现风电场数据集中管理与自动化

    某跨国电力公司利用宏Cogent DataHub软件集中管理美国西南部多个风电场的数据采集与控制,整合和实时传输OPC 服务器数据,提升了系统集成度,确保了
    的头像 发表于 11-07 10:20 193次阅读
    宏<b class='flag-5'>集</b>Cogent DataHub: 高效实现风电场<b class='flag-5'>数据</b><b class='flag-5'>集中</b>管理与自动化

    TIDP.SAA接口怎么实现I2C Read Extended功能?

    我想要支持I2C Read Extended功能,如上图所示,读出00FF数据,但是接口代码中的I2C_Read_Generic和 Read_Extended_Word并不能和TI的软件一样支持读出
    发表于 09-27 06:33

    求助,为什么噪声很小的信号通过一阶有源低通滤波器后反而引入了高频噪声?

    为什么噪声很小的信号通过一阶有源低通滤波器后反而引入了高频噪声?(信号从左边输入先经放大后再滤波,放大后的信号还是噪声非常小的)
    发表于 09-10 08:02

    DP83TC811:Open Alliance规范合规测试所用的配置

    电子发烧友网站提供《DP83TC811:Open Alliance规范合规测试所用的配置.pdf》资料免费下载
    发表于 08-27 09:50 0次下载
    DP83TC811:<b class='flag-5'>Open</b> Alliance规范合规<b class='flag-5'>性</b>测试所用的配置

    AMC1200BDUBR在工作时引入了112MHz和132MHz的EMC噪声,请问电路要怎么改进才能消除这个噪声?

    请问前辈,我用的TI芯片:AMC1200BDUBR 在工作时引入了112MHz和132MHz的EMC 噪声。请问电路要怎么改进才能消除这个噪声?望前辈能帮忙推荐解决方法 不胜感激!
    发表于 08-22 06:26

    PyTorch如何训练自己的数据

    PyTorch是一个广泛使用的深度学习框架,它以其灵活性、易用和强大的动态图特性而闻名。在训练深度学习模型时,数据是不可或缺的组成部分。然而,很多时候,我们可能需要使用自己的数据
    的头像 发表于 07-02 14:09 1756次阅读

    基于毫米波的人体跟踪和识别算法

    了RadHAR,这是一种使用稀疏和非均匀点云执行精确HAR的框架。RadHAR利用滑动时间窗口来累积毫米波雷达的点云,并生成体素化表示,作为分类器的输入。 我们在收集的具有5种不同活动的人类活动数据
    发表于 05-14 18:40

    微软MSN天气服务引入全新AI模型

    微软在天气预测领域取得了突破的进展,为MSN天气服务引入了全新的AI预测模型。该模型由微软Start团队精心研发,并基于他们在arXiv上发表的最新论文。这一创新模型结合了五种不同的人工智能模型和三种深度学习架构,形成了一个强
    的头像 发表于 05-07 09:25 570次阅读

    美英等10国共守6G无线通信原则,推进国际合作与技术创新

    设立基于全球行业领导力和包容性标准的规则制度。6G须依据全球通用的标准、接口及规范进行运作,这其中包含了公开、透明、公平且基于共识的决策程序。
    的头像 发表于 02-28 09:43 607次阅读

    CCG5 platform Flash在烧写images时,如何保留产线校准数据

    和板卡信息丢失 2. PSoC Programmermer没法擦除指定flash,都是整个128K擦除,例如在flash中分配一个row来存储产线校准数据,如何保证在烧写images后,保留产线校准数据呢?谢谢
    发表于 02-27 06:02

    集中电源控制器在数据中心的应用

    中心中,集中电源控制器可以集成管理多个电源设备,实现统一控制和监测。通过集中电源控制器,数据中心管理人员可以远程监控和控制电源设备的运行状态,及时发现和解决电源故障,提高数据中心的可靠
    的头像 发表于 01-30 15:24 511次阅读
    <b class='flag-5'>集中</b>电源控制器在<b class='flag-5'>数据</b>中心的应用

    Harvard FairSeg:第一个用于医学分割的公平数据

    为了解决这些挑战,我们提出了第一个大规模医学分割领域的公平数据, Harvard-FairSeg。该数据旨在用于研究公平
    的头像 发表于 01-25 16:52 560次阅读
    Harvard FairSeg:第一个用于医学分割的公平<b class='flag-5'>性</b><b class='flag-5'>数据</b><b class='flag-5'>集</b>

    超级电容器在集中器中的应用

    单元)和下部多个终端或仪表。它负责管理整个系统、收集和存储所有数据以及管理上层和下层之间的通信通道。集中器在电力系统有着重要作用,所以自身的可靠也尤为重要,除了设备的本身质量以外,备用电源的选择也是
    发表于 01-15 16:51