0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

检测AI中的常见认知偏差

汽车玩家 来源:今日头条 作者:闻数起舞 2020-05-03 18:23 次阅读

在过去的几年中,随着AI解决方案在我们的日常生活中越来越根深蒂固,人工智能(AI)的偏见已成为热门话题。 作为转向数据科学的心理学家,这个话题非常贴切。

为了避免使AI模型产生偏差,首先必须意识到存在各种各样的偏差。

为了检测偏见,必须意识到它的存在。

为此,本文将指导您解决在开发AI的不同阶段中可能遇到的许多常见和不常见的偏见。 这些阶段包括:

· 数据采集

· 数据预处理

· 数据分析

· 建模

希望,了解您可能遇到的偏见将有助于您开发偏见较少的AI解决方案。

1.什么是偏见?

偏见被认为是对一个想法或事物的偏爱或偏见。 偏见通常是在人类的背景下想到的,但它可以存在于许多不同的领域:

· 统计信息-例如,统计信息的系统失真

· 研究-例如,偏向于发表某些实验性重大成果

· 社会科学-例如,对某些人群的偏见

在本文中,我们将结合几个领域,在这些领域中可能会出现(认知)偏差,以了解偏差如何进入人工智能。

在下文中,我将经历AI开发的常见阶段,并确定步骤以检测可能在哪里发现偏差。

2.数据收集

数据收集是您会发现偏见的第一个也是最常见的地方之一。 造成这种情况的最大原因是,数据通常是由人收集或创建的,从而允许错误,离群值和偏差易于渗入数据中。

数据收集过程中常见的偏见:

· 选择偏差-选择数据时样本不能代表总体的数据选择

例如,在许多社会研究中,研究人员一直在使用学生作为参与者,以检验其假设。 学生显然不能代表一般人群,并且可能会偏向所发现的结果。

Selection Bias

· 框架效应-调查以特定倾向构建的问题。

如下图所示,如果这个问题的答案是肯定的,那么人们更有可能挽救200条生命,而挽救所有人的几率是33%。

检测AI中的常见认知偏差

当出现正构架提示(“挽救200条生命”)时,有72%的参与者选择了治疗A,而当出现负构架提示(“ 400人将死亡”)时,则下降为22%。

· 系统性偏差-这是一个一致且可重复的错误。

这通常是设备故障的结果。 由于此错误很难检测,因此更正此错误很重要。 必须对机械或过程有充分的了解。

检测AI中的常见认知偏差

Systematic Error

· 回应偏见—一系列偏见,参与者对问题的回答不正确或错误。

答复偏见经常出现在问卷中。 由于这些都是参与者填写的,因此人为偏见很容易在数据中找到。 例如,《社会可取性偏见》指出人们很可能否认其反应中的不良特征。 这可以通过强调良好行为或低估不良行为来实现。 类似地,"问题顺序偏向"指出人们可能会根据问题的顺序不同地回答问题。

重要的是要了解,您如何设计收集过程会严重影响将要收集的数据类型。 如果不小心,您的数据将严重偏向某些群体。 任何结果分析都可能有缺陷!

3.数据预处理

检测AI中的常见认知偏差

处理数据时,可以采取许多步骤来准备进行分析:

· 离群值检测

您通常希望删除异常值,因为它们可能对某些分析产生不成比例的影响。 在所有人都在20到30岁之间的数据集中,一个110岁的人可能不太能代表数据。

· 缺失值

您如何处理某些变量的缺失值会引入偏差。 如果要用均值填充所有缺失值,那么您有意将数据推向均值。 这可能会使您偏向表现更接近均值的某些群体。

· 筛选资料

我已经多次看到这种情况,对数据进行了如此多的过滤,以致于它几乎不再代表目标人群。 这以某种方式将选择偏差引入数据。

4.数据分析

在开发AI解决方案时,最终产品可能是模型或算法。 但是,在数据分析中也很容易发现偏差。 通常,我们会在数据分析中看到以下偏见:

· 误导图-扭曲的图,它歪曲了数据,因此可能从中得出不正确的结论。

例如,当报告分析结果时,数据科学家可以选择将其图的y轴从0开始。尽管这不会在数据本身中引入偏差,但由于差异似乎是 更明显(见下图)。

检测AI中的常见认知偏差

如果Y轴从0%开始,则农作物产量的差异似乎很小。但是,简单地将其更改为从70%开始会产生看似不同的观点,而结果实际上是相同的。

如果您想进一步了解误导图的影响,强烈建议您阅读"如何利用统计数据撒谎"一书!

· 确认偏见—倾向于专注于确认先入之见的信息的倾向。

假设您认为癌症和喝酒之间有很强的关系。 在执行分析时,您仅通过不考虑任何混淆变量来搜索以确认该假设。

检测AI中的常见认知偏差

The confirmation Bias

这似乎是一个极端的例子,您将永远做不到。 但是现实是,人类天生就有偏见,这很难撼动。 发生在我身上的次数比我想承认的要多!

5.建模

检测AI中的常见认知偏差

当谈论AI的偏见时,人们通常指的是某种程度上有利于特定人群的AI系统。 一个很好的例子就是亚马逊创建的招聘算法,该算法在决策中显示了性别偏见。 他们用于此算法的数据主要由担任技术职务的男性组成,这使其倾向于使用男性作为高潜力候选人。

这是垃圾填充现象的经典示例,其中您的AI解决方案仅与您使用的数据一样好。 这就是为什么在开始对数据进行建模之前检测数据中的偏差如此重要的原因。

让我们研究一下在创建预测模型时经常会看到的几种类型的偏差:

· 偏差/方差折衷-偏差(模型的基本假设)和方差(如果使用不同的数据,则预测的变化)之间的折衷。

具有高方差的模型将过多地关注火车数据,并且不能很好地推广。 另一方面,高偏差假定数据始终以相同的方式运行,这很少是正确的。 当增加偏见时,通常会降低方差,反之亦然。 因此,我们经常寻求平衡偏见和差异。

检测AI中的常见认知偏差

Demonstrating the effect of the trade-off between bias and variance.

· 概念漂移–一种现象,目标变量的统计属性会随时间发生意外变化。

假设您创建了一个模型,可以预测在线商店中客户的行为。 该模型起初很棒,但一年后性能下降。 发生的事情是客户的行为在过去一年中发生了变化。 客户行为的概念已经改变,并对模型的质量产生负面影响。

解决方案可能只是简单地使用新数据重新训练您的模型,以便及时掌握新行为。 但是,可能需要一个全新的模型。

检测AI中的常见认知偏差

The original data (left) versus concept drift (right) after time has passed and new data was added.

· 分类不平衡-(目标)分类频率的极端不平衡。

假设您要对图片包含猫还是狗进行分类。 如果您有1000张狗的照片而只有10张猫的照片,则存在类不平衡。

阶级失衡的结果是该模型可能偏向多数阶级。 由于数据中的大多数图片都是狗,因此该模型只需要始终猜测"狗"即可达到99%的准确率。 实际上,该模型尚未了解到猫和狗的图片之间的差异。 可以通过选择正确的验证措施(例如,平衡准确度或F1得分而不是准确度)来补救。

6.接下来是什么?

在了解了AI解决方案中的所有这些潜在偏见之后,您可能会认为:

"但是我该如何消除解决方案中的偏见?"

我认为,要解决偏见,您需要了解其根源。 知道是成功的一半。 之后,由您自己确定消除或处理该特定偏差的方法。 例如,如果您发现问题是由于数据中的选择偏差引起的,那么最好添加其他数据。 如果类别不平衡使您的模型更偏向多数群体,那么您可以研究重采样策略(例如SMOTE)。

注意:有关常见认知偏差的交互式概述,请参见此惊人的可视化。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29925

    浏览量

    268217
  • 人工智能
    +关注

    关注

    1791

    文章

    46736

    浏览量

    237280
收藏 人收藏

    评论

    相关推荐

    莫拉维克悖论与多模态AI:迈向机器人认知的新时代

    莫拉维克悖论揭示了人工智能系统在处理高级推理与基本感知运动技能上的巨大差异。对于AI而言,复杂的逻辑任务似乎比人类习以为常的感知运动技能更容易实现。这一悖论凸显了当前AI与人类认知能力之间的鸿沟。
    的头像 发表于 10-26 15:00 465次阅读

    检测系统中常见的信号类型有哪些

    检测系统常见的信号类型多种多样,这些信号类型根据被测物理量的不同而有所区别。以下是一些常见的信号类型: 位移信号 :位移信号是检测系统
    的头像 发表于 10-15 13:57 309次阅读

    甲烷浓度检测仪中常见检测技术及其应用

    甲烷浓度检测仪中常见检测技术及其应用
    的头像 发表于 07-08 10:47 530次阅读
    甲烷浓度<b class='flag-5'>检测</b>仪中<b class='flag-5'>常见</b>的<b class='flag-5'>检测</b>技术及其应用

    新一代智能插件AOI用极速编程颠覆了传统AOI认知

    为了解决传统AOI自动光学检测设备存在的问题,新一代AI视觉前沿技术公司将神经网路深度学习算法应用于AOI,匠心打造了D系列产品,用极速编程颠覆了传统AOI认知
    的头像 发表于 06-25 15:00 637次阅读
    新一代智能插件AOI用极速编程颠覆了传统AOI<b class='flag-5'>认知</b>

    三星电容的容量偏差范围是多少?

    三星电容的容量偏差范围取决于具体的电容型号、规格以及精度等级。容量偏差范围通常用来描述实际电容量与标称电容量之间的最大允许偏差,这是电容器性能的一个重要指标。   在三星电容,常用的
    的头像 发表于 05-21 14:18 388次阅读

    搭载星火认知大模型的AI鼠标:一键呼出AI助手,办公更高效

    搭载星火认知大模型的AI鼠标:一键呼出AI助手,办公更高效 在这个AI时代,如果你想在激烈竞争的职场不被淘汰,讯飞
    的头像 发表于 03-25 11:52 447次阅读
    搭载星火<b class='flag-5'>认知</b>大模型的<b class='flag-5'>AI</b>鼠标:一键呼出<b class='flag-5'>AI</b>助手,办公更高效

    爱立信推出认知软件新功能

    日前,爱立信宣布在其专为运营商设计的认知软件组合,新增采用“可解释性人工智能(Explainable AI,XAI)”的新功能,进一步加速在网络设计和优化采用人工智能后的价值转化。
    的头像 发表于 02-22 09:22 5197次阅读

    AI写作神器!搭载讯飞星火认知大模型,能够智能写作的键盘!

    一款全新的AI写作神器应运而生。这款神器搭载了讯飞星火认知大模型,能够智能写作,带来前所未有的写作体验。 一、写作功能特点 自动写作:讯飞星火认知大模型可自动根据用户输入的主题和关键词,生成符合要求
    的头像 发表于 01-04 16:40 675次阅读
    <b class='flag-5'>AI</b>写作神器!搭载讯飞星火<b class='flag-5'>认知</b>大模型,能够智能写作的键盘!

    科大讯飞AI智能键盘D1:星火认知大模型助力的你的办公效率

    在紧张的工作环境,高效便捷的工具是我们提高工作效率的重要武器。科大讯飞AI智能键盘D1,作为一款集成了讯飞星火认知大模型的智能键盘,不仅拥有高效的打字体验和丰富的智能化功能,更能够帮助您提升办公
    的头像 发表于 01-02 10:17 451次阅读

    ADXL355测试发现检测的精度较差,和实际温度值有偏差是什么原因?

    ADXL355 芯片内部自带一个温度传感器,测试发现检测的精度较差,和实际温度值有偏差,请问这个什么原因?有规律吗吗?
    发表于 12-28 07:58

    AI算法在燃气站的工作原理,安全帽、抽烟、打电话检测的具体应用,如何利用AI提升安全水平

    AI算法在燃气站安全管理的应用,包括烟火检测、安全帽识别、抽烟、打电话检测等方面的工作原理。AI算法助力燃气站安全管理,烟火
    的头像 发表于 12-26 21:25 591次阅读

    电压偏差和电压损失的关系是什么?如何确定线路电压损失?

    电压偏差和电压损失的关系是什么?如何确定线路电压损失? 电压偏差是指实际的电压值与额定电压之间的差异。电压损失则是指电能在输送过程由于电阻、电感、电容等因素引起的能量损失。 电压偏差
    的头像 发表于 12-25 17:19 583次阅读

    晶振频率偏差过大怎么办?教你如何解决晶振频率偏差过大问题

    偏差过大的原因以及如何解决这些问题。 1. 频率偏差的原因: 晶振频率偏差过大的原因可能是多种多样的。以下是一些常见的原因: 1.1 温度变化:晶体振荡器的频率往往随着温度的变化而变化
    的头像 发表于 12-18 14:30 2052次阅读

    大型多GHz时钟树的相位偏差设计

    电子发烧友网站提供《大型多GHz时钟树的相位偏差设计.pdf》资料免费下载
    发表于 11-22 16:56 0次下载
    大型多GHz时钟树<b class='flag-5'>中</b>的相位<b class='flag-5'>偏差</b>设计

    LabVIEW和NIUSRP硬件加快了认知无线电开发

    ,CAV和BCED算法在评估来自更高级检测算法的增益上比标准能量检测(ED)算法效果更好。此方法可在瑞利通道感应信噪比为-17dB的PMSE信号,感应时间为100毫秒,检测率达90%
    发表于 11-18 21:32