0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超过两亿张!斯坦福大学“洗脑”人脸识别数据库

hl5C_deeptechch 来源:YXQ 2019-07-26 11:30 次阅读

在美国,很多公司和研究人员基于众多“人脸识别数据库”进行编译和分析,这些图片在全球被广泛流传,而这些操作都是在人们不知情的情况下进行的。

根据《纽约时报》报道,“人脸识别数据库”抓取从社交网站、图片网站、像 OkCupid 这样的约会网站,以及在餐厅和大学校园架设的摄像机得来的图片。虽然目前的数据尚不精确,隐私维权者还是指出,微软建立的数据库有超过一亿张图片,斯坦福大学有超过两亿张。

图 | MS Celeb 数据库中 2000 个人像信息可视化图

这样大规模的面部收集是为了能快人一步创造出领先的人脸识别技术。这项技术需要尽可能多地运用“神经网络”分析数字图片,从而鉴别人类。而所谓的“神经网络”是一个复杂的算法系统,它建立在大批量的数据所建立的认知模型上。

收集面部图像的过程已经进行了十多年,但建立面部识别技术需要包括数据库在内的更多条件,涉及到生物学、生理学、心理学、认知学、图像图形学、模式识别等领域,数据库只是其中一个层面。人们往往不知道他们的图片已经在数据集中。尽管照片上没有名字,但是每个人都可以被认出来,因为每张脸都是独一无二的。

根据研究报告显示,像 Facebook 和 Google 这样的科技巨头聚集了大量的人脸识别数据,这些数据是不会被散播的。但根据一些学者、相关人士和公开论文显示,一些公司和大学与澳大利亚、中国、印度、新加坡和瑞士的研究人员、政府和私人企业广泛分享了他们的图像数据。

数据集所带来的问题正在凸显,因为目前所启用的技术正在以潜在的入侵方式被使用。近日公布的文件显示,美国移民和海关执法局用这一技术扫描司机照片以识别非法移民。根据美国政府问责局上个月的一份报告,美国联邦调查局在过去十年里使用这一技术将驾照和签证照片与犯罪嫌疑人的脸进行对比。7 月 10 日,美国国会听证会就该技术的使用问题进行了讨论。

由于缺少对数据集的监管,人们的肖像可能被用在有道德问题的科技上,甚至这些照片会被滥用,维权者对这其中的可能性表示愤怒。

过去几周,出于隐私考虑,微软和斯坦福大学这类的公司和大学已经从互联网上抹掉了它们的人脸识别数据。但研究人员和维权者认为,鉴于这些图像早已被广泛散播出去,它们仍将在美国和其他地方被使用。

图 | “洗脑”数据已从斯坦福大学文献库删除

斯坦福大学在 2014 年建立的人脸识别数据库被称为“洗脑”(Brainwash),在三天时间里,研究人员用相机拍摄超过 10000 张图像并存入数据库,这些数据被用来与其他人分享。但当时咖啡厅的顾客并不知道自己被拍照且照片被用来做技术研究。

杜克大学的研究人员也在 2014 年用八台摄像机建立了一个人脸识别数据库,这些摄像机架设在校园里,这些摄像头上标有号码和电子邮件,不想被拍摄的人可以跟他联系。根据报道,杜克大学的研究人员最终收集到了 200 多万帧视频,其中包含 2700 多人的图像。但这些图像可能因为角度和采光原因不能被采用。

微软声称他们建立了最大的面部数据集之一。这个名为 MS Celeb 的数据集包括超过 10 万人的 1000 万张照片。MS Celeb 表面上是一个名人数据库,因为数据都来自公众人物,这些图片也被认为是公平的。但这仍然招来维权人士的不满。这一数据库曾在国际间传播,但在今年春天被维权者发现之后便被撤下。

对此,民间成立了一个名为“监视技术监督项目”的民权和隐私组织,该组织建立了一个工具,可以让人们检查他们的肖像是否被收集在公开分享的人脸数据库中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3770

    浏览量

    64298
  • 人脸识别
    +关注

    关注

    76

    文章

    4007

    浏览量

    81798

原文标题:大型数据库支持面部识别抓取,隐私何处安放?

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

    一个运行在存储上的SQLServer数据库,有1000多个文件,大小几十TB。数据库每10天生成一个NDF文件,每个NDF几百GB大小。数据库包含个LDF文件。 存储损坏,
    的头像 发表于 10-31 13:21 153次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—通过拼接<b class='flag-5'>数据库</b>碎片恢复SQLserver<b class='flag-5'>数据库</b>

    数据库数据恢复—SQL Server数据库出现823错误的数据恢复案例

    SQL Server数据库故障: SQL Server附加数据库出现错误823,附加数据库失败。数据库没有备份,无法通过备份恢复数据库
    的头像 发表于 09-20 11:46 300次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>出现823错误的<b class='flag-5'>数据</b>恢复案例

    数据库数据恢复—SQL Server数据库所在分区空间不足报错的数据恢复案例

    SQL Server数据库数据恢复环境: 某品牌服务器存储中有组raid5磁盘阵列。操作系统层面跑着SQL Server数据库,SQL Server
    的头像 发表于 07-10 13:54 458次阅读

    谷歌Gemini Ultra模型训练成本近2亿美元

    斯坦福大学与研究巨头Epoch AI联合揭示了云计算时代下AI模型训练成本的飞速增长。最新研究结果显示,AI巨头OpenAI的GPT-4训练成本高达7840万美元,这一数字令人咋舌。
    的头像 发表于 06-07 09:36 566次阅读

    斯坦福团队抄袭国产大模型,主要责任人失联

    电子发烧友网报道(文/吴子鹏)近日,斯坦福大学AI团队主导的Llama3-V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5。该事件引起了业界
    的头像 发表于 06-05 00:10 2570次阅读

    斯坦福大学研发全新AI辅助全息成像技术

    据最新消息,斯坦福大学的研究人员成功研制出全新AI辅助全息成像技术,其薄度、重量及质量均超过了当前方案,有望推动增强现实(AR)眼镜领域的发展。
    的头像 发表于 05-10 14:48 554次阅读

    数据库数据恢复—raid5阵列上层Sql Server数据库数据恢复案例

    数据库故障: 数据库文件丢失,主要涉及3个数据库,数千表。数据库文件丢失原因未知,不能确定丢失的
    的头像 发表于 05-08 11:43 486次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—raid5阵列上层Sql Server<b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复案例

    斯坦福发布《2024 AI指数报告》

    近日,斯坦福大学以人为本人工智能研究所(StanfordHAI)发布了《2024年人工智能指数报告》(ArtificialIntelligenceIndexReport2024)。据
    的头像 发表于 04-18 08:28 748次阅读
    <b class='flag-5'>斯坦福</b>发布《2024 AI指数报告》

    斯坦福继Flash Attention V1和V2又推出Flash Decoding

    斯坦福大学此前提出的FlashAttention算法,能够在BERT-large训练中节省15%,将GPT训练速度提高2/3。
    的头像 发表于 03-13 15:23 738次阅读

    英伟达CEO黄仁勋:竞争对手的芯片免费也难以比肩英伟达GPU

    根据斯坦福经济政策研究所在会上发布的视频,美国斯坦福大学Charles R. Schwab荣誉经济学教授John Shoven向黄仁勋提问: “贵公司是否能造出最尖端的芯片?
    的头像 发表于 03-11 10:08 617次阅读

    车内语音识别数据在智能驾驶中的价值与应用

    车内语音识别数据在智能驾驶中的价值与应用 一、引言 随着智能驾驶技术的不断发展,车内语音识别数据在智能驾驶中的应用越来越广泛。车内语音识别技术不仅提高了驾驶的便捷性和安全性,还为智能驾驶系统的智能化
    的头像 发表于 02-19 11:47 539次阅读

    数据库数据恢复】Oracle数据库ASM实例无法挂载的数据恢复案例

    oracle数据库ASM磁盘组掉线,ASM实例不能挂载。数据库管理员尝试修复数据库,但是没有成功。
    的头像 发表于 02-01 17:39 493次阅读
    【<b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复】Oracle<b class='flag-5'>数据库</b>ASM实例无法挂载的<b class='flag-5'>数据</b>恢复案例

    车内语音识别数据在智能驾驶中的应用与挑战

    一、引言 随着智能驾驶技术的不断发展,车内语音识别数据在智能驾驶中的应用越来越广泛。车内语音识别技术为驾驶员提供了更加便捷和安全的驾驶体验,同时也为智能驾驶系统的智能化和个性化提供了有力支持。本文将
    的头像 发表于 01-26 18:14 1083次阅读

    关于JSON数据库

    如何理解JSON数据库?作为NoSQL数据库的一种类型,JSON数据库有哪些优势呢?JSON数据库如何运作,它为应用程序开发者带来了哪些价值呢?
    的头像 发表于 12-06 13:46 846次阅读
    关于JSON<b class='flag-5'>数据库</b>

    oracle数据库的基本操作

    、创建表、插入数据、查询数据、更新数据和删除数据等。 首先,连接到Oracle数据库是进行任何操作的第一步。在连接之前,需要确保已安装Ora
    的头像 发表于 12-06 10:14 670次阅读