它们真正告诉我们关于AI偏差的什么信息？-电子发烧友网

这是一个惊人的图像，说明了AI研究的根深蒂固的偏见。将美国第一任黑人总统巴拉克·奥巴马（Barack Obama）的低分辨率图片输入到旨在生成去像素脸部的算法中，然后输出的是白人。

也不仅仅是奥巴马。获取相同的算法，以从低分辨率输入生成女演员露西·刘或女议员亚历山大·奥卡西奥·科尔特斯的高分辨率图像，并且所产生的面孔看起来明显是白色的。正如一则流行的推文援引奥巴马的例子所言：“这张图片充分说明了人工智能存在偏见的危险。”

但是，是什么原因导致这些输出的呢？它们真正告诉我们关于AI偏差的什么信息？

首先，我们需要对这里使用的技术有所了解。生成这些图像的程序是称为PULSE的算法，该算法使用一种称为“放大”的技术来处理视觉数据。升级就像在电视和电影中看到的“缩放和增强”这样的比喻，但是与好莱坞不同，真实的软件不能仅仅从无到有地生成新数据。为了将低分辨率图像转换成高分辨率图像，该软件必须使用机器学习来填补空白。

对于PULSE，执行这项工作的算法是StyleGAN，它是由NVIDIA研究人员创建的。尽管您以前可能没有听说过StyleGAN，但您可能对它的工作很熟悉。这是负责制作那些怪异逼真的人脸的算法，您可以在ThisPersonDoesNotExist.com等网站上看到这些人脸;如此真实的面孔经常被用来制作虚假的社交媒体资料。

PULSE所做的是使用StyleGAN“想象”高分辨率版本的像素化输入。它不是通过“增强”原始的低分辨率图像来实现此目的，而是通过生成一个全新的高分辨率面（当像素化时看起来与用户输入的像相同）。

这意味着可以以多种方式放大每个去像素的图像，就像使用一组配料制作不同的菜肴一样。这也是为什么您可以使用PULSE来查看《毁灭战士》，《德军总部3D》的英雄，甚至是哭泣的表情符号在高分辨率下的样子的原因。并不是说算法会像“缩放并增强”底片那样“寻找”图像中的新细节。而是发明新的面孔以还原为输入数据。

从理论上讲，这种工作已经进行了几年，但是，就像AI界经常发生的那样，当这个周末在网上共享了易于运行的代码版本时，它就吸引了更多的听众。那是种族差距开始扩大的时候。

PULSE的创建者说趋势很明显：当使用该算法按比例放大像素化图像时，该算法通常会生成具有白种人特征的人脸。

该算法的创建者在Github上写道：“看起来PULSE产生白色面孔的频率要比有色人种的面孔高得多。”“这种偏见很可能是从StyleGAN接受过数据集训练而来的，尽管可能还有其他我们不知道的因素。

换句话说，由于对StyleGAN进行了数据训练，因此当试图绘制看起来像像素化输入图像的人脸时，它默认为白色特征。

这个问题在机器学习中极为普遍，这也是面部识别算法在非白人和女性脸上表现较差的原因之一。用于训练AI的数据通常偏向一个人口统计学的白人，并且当程序看到不在该人口统计学中的数据时，其性能就会很差。并非巧合的是，白人主导着AI研究。

但是，奥巴马的例子所揭示的关于偏见的确切内容以及它所代表的问题可能如何得到解决都是复杂的问题。实际上，它们是如此复杂，以至于单一图像引发了AI学者，工程师和研究人员之间的激烈争论。

从技术上讲，一些专家不确定这是否是数据集偏差的一个示例。AI艺术家Mario Klingemann认为，应该归咎于PULSE选择算法本身，而不是数据。克林格曼指出，他能够使用StyleGAN从相同的像素化奥巴马图像生成更多非白色输出，如下所示：

克林格曼说，这些人脸是使用“相同的概念和相同的StyleGAN模型”生成的，但使用的搜索方法与Pulse不同，他说，我们不能仅仅从几个样本中真正判断出一种算法。他告诉The Verge：“可能有数以百万计的可能的面孔都将缩小为相同的像素模式，而且所有这些面孔都是‘正确的’。”

（顺便说一下，这也是为什么这样的工具不太可能用于监视目的的原因。这些过程创建的面孔是虚构的，并且如上面的示例所示，与输入的基本事实无关。但是，，这并不是说过去巨大的技术漏洞已阻止警察采用技术。）

但是，无论原因如何，算法的输出似乎都是有偏差的-在该工具广泛可用之前，研究人员并未注意到这一点。这说明了一种不同且普遍存在的偏见：一种在社会层面上起作用的偏见

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

分辨率

分辨率

+关注

关注
2

文章
1033

浏览量
41872
人工智能

人工智能

+关注

关注
1791

文章
46723

浏览量
237251

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

很幸运社区给我一个阅读此书的机会，感谢平台。《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们揭示了人工智能技术在生命科学领域中的广泛应用和

发表于 10-14 09:21

平衡创新与伦理：AI时代的隐私保护和算法公平

在人工智能技术飞速发展的今天，它不仅带来了前所未有的便利和效率，也暴露出了一系列伦理和隐私问题。从数据隐私侵犯到“信息茧房”的形成，再到“大数据杀熟”、AI歧视和深度伪造技术的威胁，AI的应用似乎

发表于 07-16 15:07

NPU和AI TOPS是什么？它们有哪些性能？

在当今快速发展的技术环境中，AI正在变革各行各业并推动创新，理解AI性能指标的复杂性至关重要。过去许多AI模型需要在云端运行。当我们走向由终端侧生成式

发表于 06-13 10:33 •710次阅读

AI PC:真正的AI PC,敢于下场

在过去的半年里，我们无一不在聆听关于人工智能（AI）PC的种种声音，然而当步入现实生活时，恐怕仍有众多读者对此感到迷茫：这些AI PC究竟具有哪些A

发表于 06-11 15:02 •649次阅读

使用CYT2CL进行I2C配置后，为什么无法进行传输？

的详细信息。请告诉我们为什么写入不正常。无法 I2C SCL 和 SDA 脉冲。时钟已配置，分频器寄存器已加载适当的值。

发表于 06-03 08:36

TLE987x可以读取CHIP_ID_BYTE_00至CHIP_ID_BYTE_11，谁能告诉我哪个是MSB，哪个是LSB？

我可以读取 CHIP_ID_BYTE_00 至 CHIP_ID_BYTE_11。谁能告诉我哪个是 MSB，哪个是 LSB？

发表于 06-03 06:16

三星电容的容量偏差范围是多少？

三星电容的容量偏差范围取决于具体的电容型号、规格以及精度等级。容量偏差范围通常用来描述实际电容量与标称电容量之间的最大允许偏差，这是电容器性能的一个重要指标。在三星电容中，常用的精度等级包括D

发表于 05-21 14:18 •385次阅读

为什么说u因子能够用来比较器件之间的稳定程度呢？

稳定圆能够告诉我们，在哪些区域内，放大器是可以有条件稳定的。

发表于 05-19 15:58 •397次阅读

高低温恒温试验箱的温度偏差标准揭秘

的损失。　　二、标准与规范　　关于高低温恒温试验箱的温度偏差标准，国内外都有相应的规范和标准。一般来说，高品质的高低温恒温试验箱应能够将温度偏差控制在较小的范

发表于 03-01 11:34 •918次阅读

2024年这些半导体行业告诉我，投资迎来高光

未来虽充满不确定性，但行业趋势可循。2024年半导体行业将有哪些新变化、新趋势、新机会呢？AI赋能和终端创新有望推动电子板块进入景气的上升通道。智能手机、服务器、汽车、个人电脑和AI市场值得关注。

发表于 02-25 09:14 •563次阅读

求助，关于CYUSB3314-BVXI 100焊球BGA问题

你能告诉我们哪个是CYUSB3314-BVXI/100pin中的3.3 V/SS PHY引脚，我们需要额外的铁氧体磁珠来隔离，谢谢！！

发表于 02-23 06:14

可以使用CLI命令同时使用多个miniprog4（例如，3~4）对多个CCG7x设备进行编程吗？

我有一个关于使用带有 miniprog4 的 CLI 命令编程 CCG7x 的问题。我们可以使用 CLI 命令同时使用多个 miniprog4（例如，3~4）对多个 CCG7x 设备进行编程吗？如果是，你能否详细告诉我如何使

发表于 02-22 06:30

AI PC时代正在向我们走来

AI无处不在，充满未知和期待的AI PC时代正在向我们走来，我们的生活和工作方式即将发生改变。

发表于 01-19 09:49 •563次阅读

6个关于pcb信号线的重要信息

6个关于pcb信号线的重要信息

发表于 01-05 10:34 •1063次阅读

晶振频率偏差过大怎么办？教你如何解决晶振频率偏差过大问题

晶振频率偏差过大怎么办？教你如何解决晶振频率偏差过大问题晶振频率的稳定性对于许多电子设备的正常运行非常重要。频率偏差过大可能会导致时序错误、通信失败以及计时误差等问题。在本文中，我们

发表于 12-18 14:30 •2051次阅读

搜索历史

它们真正告诉我们关于AI偏差的什么信息？

评论

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

平衡创新与伦理：AI时代的隐私保护和算法公平

NPU和AI TOPS是什么？它们有哪些性能？

AI PC:真正的AI PC,敢于下场

使用CYT2CL进行I2C配置后，为什么无法进行传输？

TLE987x可以读取CHIP_ID_BYTE_00至CHIP_ID_BYTE_11，谁能告诉我哪个是MSB，哪个是LSB？

三星电容的容量偏差范围是多少？

为什么说u因子能够用来比较器件之间的稳定程度呢？

高低温恒温试验箱的温度偏差标准揭秘

2024年这些半导体行业告诉我，投资迎来高光

求助，关于CYUSB3314-BVXI 100焊球BGA问题

可以使用CLI命令同时使用多个miniprog4（例如，3~4）对多个CCG7x设备进行编程吗？

AI PC时代正在向我们走来

6个关于pcb信号线的重要信息

晶振频率偏差过大怎么办？教你如何解决晶振频率偏差过大问题