关于AI算法能否对不同年龄、性别和肤色的人一视同仁的详细解答-电子发烧友网

Facebook研究人员发布了一个数据集，旨在帮助机器学习开发人员测试算法的偏差。

即使在不同的光照条件下，算法是否能够对不同年龄、性别和肤色的人一视同仁呢？Facebook的AI Red团队近日发布了一个名为“Casual Conversations”的数据集，用于回答这个问题。10兆字节的数据由3011名参与者录制的视频组成；数据集由每人约15个1分钟片段组成，总时长超过45000分钟。视频分别被标记出年龄和性别，由每个参与者自我报告，肤色由训练有素的注解者使用标准比例确定，以及照明条件，也由注解者确定。

Facebook AI Red团队的研究经理Cristian Canton给了我一个简单的例子，说明了开发人员是如何使用数据集的。

“考虑门户（Portal）设备，”他说。（门户是Facebook价值150美元的桌面智能屏幕。）“我们有一个摄像头，可以跟踪人们。如果我现在是工程师来构建这项技术，为了确保它的包容性，我可以获取临时会话数据集，通过门户中的跟踪算法来运行它，并测量它在哪些地方表现不好。比如说，你可能会发现，对于一个特定年龄、肤色或性别的人来说，在昏暗的光线下，这是行不通的。然后我就会知道我的算法对于特定的子组有缺陷。”

Facebook的研究人员在去年的Deepfake Detection Challenge（一项旨在开发自动识别欺诈媒体工具的竞赛）的前五名获奖者身上测试了该数据集。

在近日发布的一篇研究论文和博客文章中，他们报告说，虽然所有五种算法都在与较暗的肤色作斗争，但在年龄、性别和光照条件等方面表现最为一致的模型并不是第一名得主Selim Seferbekov，而是排名第三的团队NTechLab。有趣的是，排名第四的18岁的研究小组最擅长分析的是年龄在45岁以上的年龄组中的受试者的视频。

在不同的人群中表现平平，并不是Deep Fake Challenge的评判标准之一，因为还没有完整的非正式对话数据集。

Said Canton说：“如果我们今天重新开始比赛，也许我们会考虑寻找一个更具包容性的方法。”

Canton说，近日发布的Casual Conversations数据集只是创造人工智能公平所需工作的开始。首先，他指出，这个问题是多方面的，虽然有这样的数据是有帮助的，但这并不是最终的解决办法。

Image： FacebookThese pie charts show the frequency of the different tags for age， gender， apparent skin tone， and lighting conditions in the 45，186 videos that make up the Casual Conversations data set.

至于数据集开发本身，他说，该团队还只是在“漫长旅程的第一步”。我们已经确定了年龄、性别、肤色和光照条件，但（这些视频）都是在美国录制的。如果我们在其他国家录制，我们可能会发现更多我们需要考虑且尚未看到的多样性。”

Canton指出，录音的音频部分也代表了尚未开发的潜力。这些音频文件是通过要求受试者回答简单的对话提示（如“你最喜欢的菜是什么”）而创建的，目前只针对年龄和性别进行标记。“我们还没有对口音进行注释，但这是未来可实现的一个潜在途径。我们确实认为这篇文章可以有一些有趣的结果。不过，我们要测试音频模型的包容性。”

Canton希望，将这些数据公之于众将引发反馈，从而使数据集更丰富、更具包容性。“我很希望看到它得到采用，然后让我的同事和学者告诉我们更多他们的想法。我们希望进行自我批评。有了反馈，我们可以不断改进它。我们希望它成为衡量人工智能公平性的标准方式。”

Canton还希望这个数据集的发展能够树立一个新的标准。他对这个数据集的创建方式感到自豪，包括它是可信来源。他在我们的谈话中多次强调，3000多名受试者的付出是有报酬的，并且他们了解自己的声音和视频图像是如何被使用的，如果他们改变了参与的想法，以后可以退出。

他说：“我们正试图为负责任的人工智能在未来的样子设定一个标准，”他补充说，Facebook团队希望“激励更多的人记录扩充数据集。重要的是要做正确的事情 -- 通过使用正确的工具。”
编辑：lyn

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Facebook

Facebook

+关注

关注
3

文章
1429

浏览量
54795
机器学习

机器学习

+关注

关注
66

文章
8422

浏览量
132736
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24725
AI算法

AI算法

+关注

关注
0

文章
251

浏览量
12276

原文标题：人工智能算法对年龄、性别和肤色一视同仁吗？

文章出处：【微信号：IEEE_China，微信公众号：IEEE电气电子工程师】欢迎添加关注！文章转载请注明出处。

展现真实多元肤色，传音多肤色影像技术有多牛？

肤色影像为技术支撑，倡导每种肤色都能被公平地展现，不仅吸引了众多世界知名公众人物的积极参与，更引发了广泛的社会关注，它成为了一个让人们勇敢表达自我、追求平等与尊重的重要平台，激发了全球范围内对多元审美和包容性价值观的深入讨论。

发表于 11-15 16:22 •275次阅读

Pure path studio内能否自己创建一个component，来实现特定的算法，例如LMS算法？

TLV320AIC3254EVM-K评估模块， Pure path studio软件开发环境。问题：1.Pure path studio 内能否自己创建一个component，来实现特定的算法

发表于 11-01 08:25

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

很幸运社区给我一个阅读此书的机会，感谢平台。《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们揭示了人工智能技术在生命科学领域中的广泛应用和

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

非常高兴本周末收到一本新书，也非常感谢平台提供阅读机会。这是一本挺好的书，包装精美，内容详实，干活满满。关于《AI for Science：人工智能驱动科学创新》第二章“

发表于 10-14 09:16

HarmonyOS NEXT应用元服务开发Accessibility（信息无障碍）介绍

Accessibility（信息无障碍），是指任何人在任何情况下都能平等、方便地获取信息并利用信息。其目的是缩小全社会不同阶层、不同地区、不同年龄、不同健康状况的人群在信息理解、信息交互、信息利用

发表于 10-09 10:29

关于UCC25640x LLC谐振控制器的常见问题解答

电子发烧友网站提供《关于UCC25640x LLC谐振控制器的常见问题解答.pdf》资料免费下载

发表于 09-04 09:37 •0次下载

<b class='flag-5'>关于</b>UCC25640x LLC谐振控制器的常见问题<b class='flag-5'>解答</b>

嵌入式软件开发与AI整合

嵌入式软件开发与AI整合是当前技术发展的重要趋势之一。随着人工智能技术的快速发展，嵌入式系统越来越多地集成了AI算法，以实现更复杂的智能功能。以下是

发表于 07-31 09:25 •729次阅读

平衡创新与伦理：AI时代的隐私保护和算法公平

成了一把双刃剑，其锐利的一面正逐渐指向我们的核心价值。面对这些挑战，制定一套有效的AI治理框架和隐私保护机制变得迫在眉睫。确保AI决策

发表于 07-16 15:07

ai大模型和算法有什么区别

AI大模型和算法是人工智能领域的两个重要概念，它们在很多方面有着密切的联系，但同时也存在一些明显的区别。定义和概念 AI大模型通常是指具有大量参数和复杂结构

发表于 07-16 10:09 •1894次阅读

中伟视界：实时监控与预警，矿山罐笼超员AI算法如何保障矿工生命安全？

随着矿山智能化的发展，罐笼超员AI算法在矿山安全管理中发挥着关键作用。本文详细介绍了罐笼超员AI算法的工作原理、技术实现和应用效果，并展望了

发表于 07-12 08:54 •338次阅读

传音推进多肤色影像技术创新，提供更多元的真实肤色影像成像体验

本地市场消费者的影像成像核心诉求，传音研发了领先的多肤色影像技术，这项技术能兼容多区域多肤色类型用户，拍照效果受本地文化因素影响的差异化需求，最重要的是肤色成像准确性及包容性，成功开启了一

发表于 06-19 17:17 •452次阅读

求助，关于ESP32多核使用问题求解答

关于esp32的多核使用，除了使用xTaskCreatePinnedToCore函数来控制线程跑的核心外能否有其他的实现比如：现在有两个bin文件，每个核心同时跑不同的bin文件，这种是否能够实现。

发表于 06-17 06:28

加码多肤色影像技术这是传音找到的“出海利器“？

全球化时代，市场竞争愈演愈烈，产品差异化已然成为了企业脱颖而出的关键。在黄、白肤色长期占据人像摄影主赛道的背景下，传音就凭借独一无二的多肤色影像技术走出非洲，走向了更广阔的新兴市场。聚焦深

发表于 06-13 16:43 •427次阅读

NanoEdge AI的技术原理、应用场景及优势

NanoEdge AI 是一种基于边缘计算的人工智能技术，旨在将人工智能算法应用于物联网（IoT）设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身，从而减少数据传

发表于 03-12 08:09

各位技术大佬，请问下通信距离能否人为控制呢？

请问各位论坛技术专家们一个问题，短距离无线通信能否控制距离呢？比如设置或者做到仅在半米/一米/50米.....之内做通信的效果呢？就拿半米这个距离限定举例，能否仅在半米内通讯，范围以外

发表于 01-07 13:47

搜索历史

关于AI算法能否对不同年龄、性别和肤色的人一视同仁的详细解答

评论

展现真实多元肤色，传音多肤色影像技术有多牛？

Pure path studio内能否自己创建一个component，来实现特定的算法，例如LMS算法？

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

HarmonyOS NEXT应用元服务开发Accessibility（信息无障碍）介绍

关于UCC25640x LLC谐振控制器的常见问题解答

嵌入式软件开发与AI整合

平衡创新与伦理：AI时代的隐私保护和算法公平

ai大模型和算法有什么区别

中伟视界：实时监控与预警，矿山罐笼超员AI算法如何保障矿工生命安全？

传音推进多肤色影像技术创新，提供更多元的真实肤色影像成像体验

求助，关于ESP32多核使用问题求解答

加码多肤色影像技术这是传音找到的“出海利器“？

NanoEdge AI的技术原理、应用场景及优势

各位技术大佬，请问下通信距离能否人为控制呢？