0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

未来的人脸识别数据库中应减少面部表情偏差

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2020-11-29 09:40 次阅读

面部识别系统存在问题的原因有很多,其中最重要的一点是它们往往对某些人口群体和性别表现出偏见。近日,麻省理工学院研究人员还进行了一项新研究,即研究AI对某些面部表情的偏见。研究人员称,表情对面部识别系统的影响“至少”与戴围巾、帽子、假发或眼镜有影响一样,而且面部识别系统在这方面是用高度偏差的数据集训练的。

这项研究增加了越来越多的证据表明面部识别容易受到有害的、普遍存在的偏见的影响。研究人员去年秋天发表的一篇论文显示,亚马逊、微软等公司人工智能对顺性别男性和女性的准确率都在95%以上,但有38%的情况下,将跨性别男性误认为女性。“性别色彩项目”和美国国家标准与技术研究所(NIST)对主要供应商系统的独立基准测试表明,面部识别技术表现出种族和性别偏见,同时表明目前的面部识别程序可能非常不准确,有时错误分类率高达96%。

在他们的研究过程中,合作作者使用三种不同的领先的人脸识别模型进行了实验,这些模型在包括VGGFace2(一个包含超过9100人的300万张图片的数据库)和MS1M-ArcFace(拥有超过85000人的580万张图片)的开源数据库上进行了训练。他们将它们与四种语料库进行对比,具体规模如下:

● 这种复杂的面部表情包含了230个人在实验室控制的环境下拍摄的照片。

● 扩展的Cohn-Kanade(CK+),一个最广泛使用的用于训练和评估面部表情识别系统的数据库,包含123个人的593张照片序列

● CelebA是一个大规模的人脸属性数据集,包含10000位名人的20万张图片。

● 微软于2016年发布的一项面向公众的人脸识别基准和数据集MS-Celeb-1M,该数据集包含了100万名名人的近1000万张图片。

正如研究人员指出的那样,长期以来,学术界和企业一直从网络、电影和社交媒体等来源上搜集面部照片,以解决模型训练数据稀缺的问题。像大多数机器学习模型一样,面部识别模型需要大量的数据才能达到基本的精确度水平。但事实证明,这些数据来源通常是不平衡的,因为一些面部表情比其他表情更不常见。例如,人们倾向于在社交网络上分享更多快乐的脸,而不是悲伤的脸。

为了通过表情对四种基准语料库中的图像进行分类,研究人员使用了来自Affectiva的软件,该软件可以识别多达7种面部表情:6种基本情绪和中性表情。他们发现,在所有数据集中,“中性”图像的比例超过了60%,在微软MS-Celeb-1M名人图片库中达到83.7%。第二常见的面部表情是“快乐”,在所有的数据集中,大约90%的图像显示的是一个“中立”或“快乐”的人。至于其他5种面部表情,“惊讶”和“厌恶”的比例很少超过6%,而“悲伤”、“恐惧”和“愤怒”的比例非常低(通常低于1%)。结果也因性别而异。在VGGFace2中,“快乐”女性的数量几乎是“快乐”男性数量的两倍。

研究人员在一篇描述他们工作的论文中写道:“一方面,模型是使用高偏差的数据进行训练的,这些数据会导致异构性能。另一方面,人们只会对主流表情进行评估,隐藏了其对某些特定面部表情图像的真实表现。此外,性别偏见也很重要,因为它可能会导致男女双方的表现不同。”

接下来,研究人员进行了一项分析,以确定像CelebA这样的示例集中的面部表情偏差对面部识别系统预测的影响程度。在上述三种算法中,在显示“中性”或“高兴”表情的人脸上,性能更好,这也是训练数据库中最常见的表情。这项研究的结果表明,面部表情的差异并不能诱使系统误认为一个人是另一个人。然而,他们也暗示,面部表情偏差会导致系统的“真实”比较分数(衡量算法区分同一张脸图像的能力的分数)之间的差异高达40%。

研究人员只使用了某个软件来对情绪进行分类,这可能会在他们的实验中引入无意识的偏见,而且他们没有测试任何商业部署的系统,比如亚马逊的Rekognition、谷歌Cloud的Vision API或微软Azure的Face API。尽管如此,他们主张在未来的人脸识别数据库中减少面部表情偏差,并进一步开发适用于现有数据库和已经在问题数据集上训练过的模型的偏差减少方法。

研究人员表示:用于开发和评估人脸识别系统的人脸数据库缺乏面部表情的多样性,这一缺点之一是会导致系统存在安全漏洞,面部表情的微小变化很容易误导围绕这些有偏见的数据库开发的人脸识别系统。面部表情对人脸识别系统计算出的匹配分数有影响。这种影响可能会被利用为一个可能的漏洞,从而降低匹配的概率。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人脸识别
    +关注

    关注

    76

    文章

    4005

    浏览量

    81769
  • 面部识别
    +关注

    关注

    1

    文章

    375

    浏览量

    26619
收藏 人收藏

    评论

    相关推荐

    数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

    一个运行在存储上的SQLServer数据库,有1000多个文件,大小几十TB。数据库每10天生成一个NDF文件,每个NDF几百GB大小。数据库包含两个LDF文件。 存储损坏,数据库
    的头像 发表于 10-31 13:21 141次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—通过拼接<b class='flag-5'>数据库</b>碎片恢复SQLserver<b class='flag-5'>数据库</b>

    数据库数据恢复—SQL Server数据库出现823错误的数据恢复案例

    SQL Server数据库故障: SQL Server附加数据库出现错误823,附加数据库失败。数据库没有备份,无法通过备份恢复数据库
    的头像 发表于 09-20 11:46 287次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>出现823错误的<b class='flag-5'>数据</b>恢复案例

    隧道人脸识别门禁系统应用于隧道工程等场所的智能化安全管理系统

    控制器 接收人脸识别设备传来的信息,对人员身份进行验证。 控制门禁的开启和关闭,确保只有授权人员能够进入隧道。 3、数据库 存储人员的面部特征数据
    的头像 发表于 09-04 16:38 320次阅读
    隧道<b class='flag-5'>人脸</b><b class='flag-5'>识别</b>门禁系统应用于隧道工程等场所的智能化安全管理系统

    自研创新 数智未来 2024数据库技术大会盛大召开

    浪潮汹涌澎湃,数据库作为信息技术的核心基础设施,正以前所未用的速度推动各行各业的智能化升级。大会以“自研创新 数智未来”为主题,设置2大主会场,20+技术专场,重点围绕向量数据库与向量检索技术实践、
    的头像 发表于 08-27 18:07 596次阅读
    自研创新 数智<b class='flag-5'>未来</b> 2024<b class='flag-5'>中</b>国<b class='flag-5'>数据库</b>技术大会盛大召开

    基于FPGA的人脸识别技术

    基于FPGA(现场可编程逻辑门阵列)的人脸识别技术,是一种结合了高效并行处理能力和灵活可编程性的先进图像处理解决方案。这种技术在安全监控、身份认证、人机交互等领域具有广泛应用前景。以下将详细介绍基于FPGA的人脸
    的头像 发表于 07-17 11:42 1317次阅读

    基于OpenCV的人脸识别系统设计

    基于OpenCV的人脸识别系统是一个复杂但功能强大的系统,广泛应用于安全监控、人机交互、智能家居等多个领域。下面将详细介绍基于OpenCV的人脸识别系统的基本原理、实现步骤,并附上具体
    的头像 发表于 07-11 15:37 1.2w次阅读

    如何挑选理想的人脸识别考勤系统产品?人脸识别设备的选型

    如何挑选理想的人脸识别考勤系统产品?在挑选理想的人脸识别考勤系统产品时,需要综合考虑多个方面,包括但不限于设备的性能、兼容性、数据存储能力、
    的头像 发表于 06-05 14:59 440次阅读
    如何挑选理想<b class='flag-5'>的人脸</b><b class='flag-5'>识别</b>考勤系统产品?<b class='flag-5'>人脸</b><b class='flag-5'>识别</b>设备的选型

    通过Modbus读写数据库数据

    本文是将数据库数据转为Modbus服务端/从站,实现数据库内的数据也可以走Modbus协议通过网口或串口读写的案例,下图是通过智能网关的参数软件(在附件
    发表于 03-14 13:44

    车内语音识别数据在智能驾驶的价值与应用

    和个性化提供了有力支持。本文将详细介绍车内语音识别数据在智能驾驶的价值、应用以及面临的挑战和未来的发展趋势。 二、车内语音识别数据的价值 提高驾驶安全性:通过语音控制车辆功能,驾驶员
    的头像 发表于 02-19 11:47 524次阅读

    数据库数据恢复】Oracle数据库ASM实例无法挂载的数据恢复案例

    oracle数据库ASM磁盘组掉线,ASM实例不能挂载。数据库管理员尝试修复数据库,但是没有成功。
    的头像 发表于 02-01 17:39 477次阅读
    【<b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复】Oracle<b class='flag-5'>数据库</b>ASM实例无法挂载的<b class='flag-5'>数据</b>恢复案例

    车内语音识别数据在智能驾驶的应用与挑战

    详细介绍车内语音识别数据在智能驾驶的应用、面临的挑战以及未来的发展趋势。 二、车内语音识别数据在智能驾驶的应用 语音控制:通过车内语音
    的头像 发表于 01-26 18:14 1074次阅读

    关于JSON数据库

    如何理解JSON数据库?作为NoSQL数据库的一种类型,JSON数据库有哪些优势呢?JSON数据库如何运作,它为应用程序开发者带来了哪些价值呢?
    的头像 发表于 12-06 13:46 839次阅读
    关于JSON<b class='flag-5'>数据库</b>

    oracle数据库的基本操作

    Oracle数据库是一种关系数据库管理系统(RDBMS),广泛应用于企业级应用。它具有强大的功能和灵活的配置选项,可以满足复杂的数据处理需求。本文将介绍Oracle
    的头像 发表于 12-06 10:14 661次阅读

    oracle数据库的使用方法

    Oracle数据库是一种关系型数据库管理系统,它由Oracle公司开发和维护。它提供了安全、可靠和高性能的数据库管理解决方案,被广泛应用于企业级应用和大型数据库环境
    的头像 发表于 12-06 10:10 1180次阅读

    什么是JSON数据库

    如何理解JSON数据库?作为NoSQL数据库的一种类型,JSON数据库有哪些优势呢?JSON数据库如何运作,它为应用程序开发者带来了哪些价值呢?文章速览:什么是JSON什么是JSON
    的头像 发表于 12-02 08:04 827次阅读
    什么是JSON<b class='flag-5'>数据库</b>