0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Open Images Extended合集中引入了更具包容性的人物注释MIAP数据集

硬件三人行 来源:TensorFlow 作者:TensorFlow 2021-08-16 17:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

发布人:Google Research 软件工程师 Candice Schumann 和 Susanna Ricco

2016 年,我们推出了 Open Images。此协作版本包含约 900 万张含有标签的图像,涵盖数千个对象类别和 600 个类的边界框注释。从那之后,我们进行了多次更新,如将众包数据发布到 Open Images Extended 合集,以此提高对象注释的多样性。

更新

https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html

Open Images Extended

https://storage.googleapis.com/openimages/web/extended.html

虽然这些数据集提供的标签扩展性很强,但此类标签并没有关注人物的敏感属性,这些属性对于许多机器学习 (ML) 公平性任务(例如公平性评估和偏见缓解)至关重要。事实上,找到包含彻底标记此类敏感属性的数据集是很困难的,尤其是在计算机视觉领域。

公平性任务

https://developers.google.com/machine-learning/crash-course/fairness/video-lecture

今天,我们在 Open Images Extended 合集中引入了更具包容性的人物注释 (MIAP) 数据集。此合集包含更多完整的边界框注释,用于包含 10 万张人物图像中的的人物类层级结构。每个注释还带有可感知到的性别呈现和年龄范围等公平相关属性的标签。作为 Responsible AI 研究的一部分,越来越多的人开始关注如何减少不公平偏见,我们希望这些注释能够激励已经在使用 Open Images 的研究者,将公平分析纳入他们的研究中。

Responsible AI 研究

https://ai.google/principles/

交叉描述通过为现有图像-描述对和辅助描述添加语义相似度人工评分来扩展 MS-COCO 评估集(实线),并通过为新的图像-描述、描述-描述和图像-图像对添加人工评分来提高评分密度(虚线)*

Open Images 中的注释

原始 Open Images 数据集中的每个图像都包含图像级注释(宽泛地描述图像)和包围特定对象的边界框。为了避免对同一个对象绘制多个边界框,我们从标签候选集中临时删减了具体性较弱的类,我们将这一过程称为层级去重。举个例子,若一个图像的标签包括动物、 猫,和洗衣机则该图像的注释边界框为猫和洗衣机,而不会注释多余的类 ——动物。

图像级注释

https://cloud.google.com/vision/docs/labels

边界框

https://cloud.google.com/vision/docs/object-localizer

MIAP 数据集可用于原始 Open Images 数据,集中人物 层级包含的五个类:人物、男人、女人、男孩、女孩。由于这些标签的存在,Open Images 数据集对于推进 Responsible AI 的研究具有独特的价值,能够帮助开发者训练通用的人物检测器,访问性别和年龄范围特定的标签,以实现公平分析和偏见缓解。

Responsible AI

https://ai.google/responsibilities/responsible-ai-practices/

人物检测器

https://cloud.google.com/video-intelligence/docs/people-detection

然而,我们发现结合了层级去重和女人/女孩与男人/男孩之间的社会性区别后,原始注释会受到限制。举个例子,如果要求注释器针对女孩这一分类绘制边界框,它们便不会在图像中的男孩周围绘制边界框。注释器可能会也可能不会在某位女性周围绘制边界框,这取决于其对个人年龄的评估以及对女孩这一概念的文化性理解。此类判断在不同图像中可能会存在不一致,这取决于单独的注释器的文化背景、图像人物的外表和场景的上下文。因此,某些图像中的边界框注释会不完整,一些较为显眼的人物没有得到注释。

MIAP 中的注释

新的 MIAP 注释旨在解决这些限制,实现让 Open Images 成为推动机器学习公平性研究取得新进展的数据集的保障。我们不要求注释器为层级结构中最具体的类(例如,女孩)绘制边界框,而是将此程序反过来,要求它们为性别和年龄未知的人物分类绘制边界框。

所有人物边界框届时都将获得感知到的性别呈现(很大可能是女性、很大可能是男性,或未知)以及年龄呈现(青年、中年、老年,或未知)等标签。我们认识到性别不是二元的,个人的性别认同可能与其感知或预期的性别呈现不符,为了缓解无意识偏见对注释的影响,这里提示:注释器,与性别呈现相关的规范因文化而异,且会随时间的推移而变化。

这个过程添加了大量先前丢失的边界框。

在包含人物的 10 万张图像中,人物边界框的数量从 35.8 万左右增加到 45.4 万左右。各个感知性别呈现和感知年龄呈现的边界框数量持续增加。这些新注释为人物检测器的训练提供了更完整的基本事实,并提供了更准确的子组标签,以将公平性纳入计算机视觉研究。

预期用例

我们为人物边界框的感知年龄范围和性别呈现纳入了注释,因为我们认为有必要添加此类注释,以便提高能力,实现更好的理解以及努力缓解并消除图像理解领域,受保护子组之间的不公平偏见或不同性能。

我们注意到,标签捕获的性别和年龄范围是第三方仅根据视觉线索,而不是个人的自我认知性别或实际年龄评估出来的。我们不支持也不容忍构建或部署根据这些注释训练的性别或年龄呈现分类器,因为我们认为在公平性研究之外使用这些技术的相关风险大于任何潜在好处。

风险

https://dl.acm.org/doi/10.1145/3173574.3173582

致谢

这项研究背后的核心团队成员包括 Utsav Prabhu、Vittorio Ferrari 和 Caroline Pantofaru。同时,我们还要感谢 Alex Hanna、Reena Jana、Alina Kuznetsova、Matteo Malloci、Stefano Pellegrini、Jordi Pont-Tuset 和 Mahima Pushkarna 对本项目的贡献。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40935

    浏览量

    302512
  • 计算机视觉
    +关注

    关注

    9

    文章

    1715

    浏览量

    47707
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26259

原文标题:最新进展:将包容性人物注释纳入 Open Image Extended 数据集

文章出处:【微信号:yingjiansanrenxing,微信公众号:硬件三人行】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    格灵深瞳突破文本人物检索技术难题

    格灵深瞳参与研究的GA-DMS框架,为攻破上述技术难题提供了全新解决方案。研究团队通过数据构建和模型架构的协同改进,推动CLIP在人物表征学习中的应用,显著提升了基于文本的人物检索效果。该成果已入选EMNLP 2025 主会(自
    的头像 发表于 09-28 09:42 736次阅读
    格灵深瞳突破文本<b class='flag-5'>人物</b>检索技术难题

    【作品合集】合众HZ-T536开发板测评

    库 【HZ-T536开发板免费体验】6、使用protoc-gen-gorm生成标准化的数据结构 【HZ-T536开发板免费体验】7、开发板和esp32设备通信的准备工作 第一期合集: 微五科技CF5010RBT60
    发表于 09-12 09:37

    【作品合集】灵眸科技EASY EAI Orin Nano(RK3576)开发板测评

    引入了新一代完全基于硬件的最大 16M 像素 ISP(图像信号处理器),实现了多种算法加速器,如HDR、3A、CAC、3DNR、2DNR、锐化、去雾、增强、鱼眼校正、伽马校正等。内嵌的NPU算力高达
    发表于 09-09 09:59

    【技巧合集】labview使用单机数据库sqllite

    【Labview技巧合集】12 labview中使用单机数据库 sqllite 配套工具包及单机工具 和例程已上传个人网站#labview类#Labview#labview框架#工业自动化#上位机#自动化测试#计算机毕业设计
    发表于 09-07 19:47

    MIAP2200D凭何突破?双5G并发×全千兆网口×毫秒级无缝漫游!

    随着工业自动化、智能化进程加速,工业无线通信的重要日益凸显,MIAP2200系列工业无线客户端凭借前三款明星产品——MIAP2200S-1N2-T、MIAP
    的头像 发表于 08-29 11:36 1837次阅读
    <b class='flag-5'>MIAP</b>2200D凭何突破?双5G并发×全千兆网口×毫秒级无缝漫游!

    案例 | Cogent DataHub: 高效实现风电场数据集中管理与自动化

    案例概况CaseOverview一家跨国电力公司使用宏CogentDataHub软件,在美国西南地区建立起风电场的集中控制和数据采集系统。该系统整合来自不同风力涡轮机的OPC服务器数据
    的头像 发表于 08-08 18:29 708次阅读
    宏<b class='flag-5'>集</b>案例 | Cogent DataHub: 高效实现风电场<b class='flag-5'>数据</b><b class='flag-5'>集中</b>管理与自动化

    分享 | 集中告警管理如何提升设施安全

    提高团队响应速度,优化维护运营在工业或商业建筑中,集中告警管理已成为确保安全或检测故障的必备工具。通过将所有安全系统集中管理,企业能够将所有告警统一在一个HMI界面中,大幅提升响应速度。关键要点
    的头像 发表于 08-08 18:25 610次阅读
    宏<b class='flag-5'>集</b>分享 | <b class='flag-5'>集中</b>告警管理如何提升设施安全<b class='flag-5'>性</b>?

    方案 | 门禁和BMS:敏感建筑场所如何实现高效集中化管理?

    对于医院、数据中心、工业厂区等关键、敏感建筑而言,保障其安全必须依赖于各类系统的集中统一管理,包括视频监控、门禁控制等。通过将这些系统整合进楼宇管理系统(BMS)中,可实现对关键区域的高效监控
    的头像 发表于 08-08 18:21 774次阅读
    宏<b class='flag-5'>集</b>方案 | 门禁和BMS:敏感建筑场所如何实现高效<b class='flag-5'>集中</b>化管理?

    分享 | 集中式架构还是分布式架构?SCADA架构选型的新趋势

    HongraxIIoT在工业数字化不断推进的今天,SCADA系统早已不仅是简单的数据监控工具,它正在成为保障企业运行效率、安全和业务连续的战略核心。而“选择集中式、分布式还是混合式
    的头像 发表于 08-08 18:15 845次阅读
    宏<b class='flag-5'>集</b>分享 | <b class='flag-5'>集中</b>式架构还是分布式架构?SCADA架构选型的新趋势

    数据下载失败的原因?

    数据下载失败什么原因太大了吗,小的可以下载,想把大的下载去本地训练报错网络错误 大的数据多大?数据量有多少?
    发表于 06-18 07:04

    你知道什么是“二极管发言”吗?

    。 缺乏包容性: 对不同意见、细微差别或妥协方案完全无法理解和接受,认为不是朋友就是敌人。 容易站队、贴标签: 喜欢将人或事物快速归入某个极端阵营,并贴上非此即彼的标签。 为什么说这种发言是“二极管
    发表于 06-11 09:47

    LitePoint如何助力客户克服5G O-RAN测试挑战

    随着5G开放无线接入网(O-RAN)领域的日益成熟,无线通信提供商们迎来了一个契机:通过引入包容性的多供应商模式,在现今单一供应商5G部署的基础上,兑现O-RAN作为开源标准的承诺。
    的头像 发表于 06-09 10:48 1353次阅读
    LitePoint如何助力客户克服5G O-RAN测试挑战

    WPP Media发布业内首个「大营销模型」Open Intelligence

    全新数据解决方案和开创「大营销模型」,通过预测智能提升营销表现,驱动业务增长 上海 2025年6月4日 /美通社/ -- 今天,WPP Media正式推出 Open Intelli
    的头像 发表于 06-04 16:12 801次阅读
    WPP Media发布业内首个「大营销模型」<b class='flag-5'>Open</b> Intelligence

    关于CCG5 platform Flash问题,在烧写images时,如何保留产线校准数据

    和板卡信息丢失 2. PSoC Programmermer没法擦除指定flash,都是整个128K擦除,例如在flash中分配一个row来存储产线校准数据,如何保证在烧写images后,保留产线校准数据呢?谢谢
    发表于 05-30 07:50

    工业设备数据集中监控可视化管理平台是什么

    工业设备数据集中监控可视化管理平台是一种用于整合、监控和可视化工业设备数据的综合系统,旨在帮助企业实现设备数据
    的头像 发表于 05-06 11:10 1193次阅读