对机器学习算法公平性的研究

机器学习公平性的研究真的走在正确的道路上吗?

随着人工智能的发展，机器学习的技术越来越多地被应用在社会的各个领域，来帮助人们进行决策，其潜在的影响力已经变得越来越大，特别是在具有重要影响力的领域，例如刑事判决、福利评估、资源分配等。

因此可以说，从社会影响层面来讲，考虑一个机器学习系统在做(有高影响力的)决策时，是否会对弱势群体造成更加不利的影响，至关重要。

那么如何评估一个机器学习系统的公平性程度呢?目前普遍的方法就是，拿着待评估的系统在一些静态(特别强调)的数据集上跑，然后看误差指标。事实上，现在有许多测试机器学习公平性的工具包，例如AIF360、Fairlearn、Fairness-Indicators、Fairness-Comparison等。

虽然这些工具包在一些任务中能够起到一定的指导作用，但缺点也很明显：它们所针对的都是静态的、没有反馈、短期影响的场景。这一点从评估方法中能够体现出来，因为数据集是静态的。

然而现实生活中大多数却是动态的、有反馈的场景，机器学习算法运行的背景往往对算法的决策具有长期的关键性影响。

因此针对机器学习算法公平性的研究，从静态公平到动态公平，从单线公平到有反馈的公平，从短期公平到长期公平，是重要且必要的一步。

近日，来自谷歌的数位研究人员针对这一问题，在近期于西班牙举办的ACM FAT 2020会议(关于计算机技术公平性的国际会议)上发表了一篇论文，并基于这篇论文的研究开发了一组模拟组件ML-fairness-gym，可以辅助探索机器学习系统决策对社会潜在的动态长期影响。

论文及代码链接：https://github.com/google/ml-fairness-gym

一、从案例开始

先从一个案例——借贷问题——开始。

这个问题是机器学习公平性的经典案例，是由加州大学伯克利分校的Lydia T. Liu等人在2018年发表的文章《Delayed Impact of Fair Machine Learning》提出的。

他们将借贷过程进行了高度的简化和程式化，从而能够让我们聚焦于单个反馈回路以及其影响。

在这个问题的程式化表示中，个体申请人偿还贷款的概率是其信用评分的函数。

每个申请人都会隶属一个组，每个组具有任意数量的组员。借贷银行会对每个组组员的借贷和还款能力进行观察。

每个组一开始有不同的信用评分分布，银行尝试确定信用评分的阈值，阈值可以跨组应用并对每个组进行调整，从而让银行最好地达到目标。

信用评分高于阈值的申请人可以获得贷款，低于阈值的申请人则被拒绝贷款。当模拟系统选择一个申请人时，他们是否偿还贷款是根据他们所在组的偿还概率随机决定的。

在该案例中，当前申请贷款的个人，可能会在未来申请更多的贷款，所以他们可以通过偿还贷款来提高他们的信用评分以及其所在组的平均信用评分。同样地，如果申请人没有偿还贷款，那么所在组的平均信用得分则会降低。

最有效的阈值设置取决于银行的目标。

如果一家银行追求的是总利润最大化，那么它可能会根据申请人是否会偿还贷款的可能性进行评估，来设置一个能够最大化预期回报的阈值。

如果不考虑其他因素，银行将试图使其总利润最大化。利润取决于银行从偿还贷款中获得的金额与银行从违约贷款中损失的金额之比。在上图中，这个损益比是1比-4。随着损失相对于收益变得越大，银行将更加保守地发放贷款，并提高贷款门槛。这里把超过这个阈值的部分称为选择率。

而有的银行寻求的可能是能否对所有组做到公平。因此它们会尝试设置一个能够平衡总利润最大化和机会均等的阈值，其中机会均等的目标则是实现平等的 true positive rates(TPR，又称作灵敏度和召回率，衡量的是偿还过贷款的申请人将被给予贷款)。

在这一场景下，银行应用机器学习技术，基于已经发布的贷款和收入情况，来决定最有效的阈值。然而，由于这些技术往往关注的是短期目标，它们对于不同的组，可能会产生意料之外的和不公正的结果。

上面两幅图：改变两组超过100个模拟步骤的信用评分分布。第 2 组最初的信用评分较低，因此属于弱势群体。下面两幅图：左图为模拟过程中第一组和第二组的银行现金，右图为模拟过程中第一组和第二组的TPR。

二、静态数据集分析的不足之处

在机器学习领域中，评估借贷等场景的影响的标准方法就是将一部分数据作为“测试集”，并使用这个测试集来计算相关的性能指标。然后，通过观察这些性能指标在显著组之间的差异，来评估公平性。然而我们很清楚，在有反馈的系统中使用这样的测试集存在两个主要的问题：

第一，如果测试集由现有系统生成，它们可能是不完整的或者会在其他系统中显示出内在的偏差。在借贷案例中，测试集就可能是不完整的，因为它仅仅只涵盖曾经被发放过贷款的申请人是否偿还贷款的信息。因此，数据集可能并没有包括那些此前未被批准贷款或者没有被发放贷款的申请人。

第二，机器学习系统的输出会对其未来的输入产生影响。由机器学习系统决定的阈值用来决定是否发放贷款，申请人是否偿还这个贷款会影响到它们未来的信用评分，之后也会反馈到机器学习系统中。这些问题都突出了用静态数据集来评估公平性的缺陷，并促使研究者需要在部署了算法的动态系统中，分析算法的公平性。

三、可进行长期分析的模拟工具：ML-fairness-gym

基于上述需求，谷歌研究者开发出了ML-fairness-gym 框架，可以帮助机器学习从业者将基于模拟的分析引入到其机器学习系统中。这个组件已在多个领域被证明，在分析那些难以进行封闭形式分析的动态系统上是有效的。

ML-fairness-gym 使用了 Open AI 的 Gym 框架来模拟序列决策。在该框架中，智能体以循环的方式与模拟环境交互。在每一步，智能体都选择一个能够随后影响到环境状态的动作。然后，该环境会显示出一个观察结果，智能体用它来指导接下来的动作。

在该框架中，环境对系统和问题的动态性进行建模，而观察结果则作为数据输入给智能体，而其中智能体可以视为机器学习系统。

在借贷案例中，银行充当的角色是智能体。它以从环境中进行观察，从而接收贷款申请人以及他们的信用评分和组成员的信息，并以接受贷款或拒绝贷款的二分决策来执行动作。然后，环境对申请人是否成功偿还贷款进行建模，并且据此来调整申请人的信用评分。ML-fairness-gym 可以通过模拟这些结果，从而来评估银行政策对于所有申请人的公平性的长期影响。

四、公平性并不是静态的：将分析扩展到长期影响

由于Liu 等人对借贷问题提出的原始公式，仅仅考量了银行政策的短期影响结果，包括短期利润最大化策略(即最大化奖励智能体)和受机会均等(EO)约束的策略。而研究者使用 ML-fairness-gym ，则能通过模拟将分析扩展到长期影响。

上图：最大化奖励智能体和机会均等智能体的累计放贷额，按申请人所隶属的组划分，蓝色代表第 1 组，绿色代表第2组。下图：模拟过程中的组平均信用评分(由各组有条件的偿还概率量化而得出)。机会均等智能体增加了第2组的贷款通过率，但是加大了第2 组与第1 组合的信用评分差距。

谷歌研究者基于对上述借贷问题的长期分析得到了两个发现：

第一，正如Liu等人所发现的，机会均等智能体(EO 智能体)有时会对弱势群体(第2组，最初的信用评分更低)设置比最大化奖励智能体更低的阈值，从而会给他们发放超出原本应该给他们发放的贷款。这导致第2组的信用评分比第 1 组下降的更多，最终造成机会均等智能体模拟的两组组之间的信用评分差距比最大化奖励智能体模拟的更大。

同时，他们在分析中还发现，虽然机会均等智能体让第2 组的情况似乎变得更糟，但是从累计贷款图来看，弱势的第2 组从机会均等智能体那里获得了明显更多的贷款。

因此，如果福利指标是收到的贷款总额，显然机会均等智能体对弱势群体(第 2组)会更有利; 然而如果福利指标是信用评分，那么显然机会均等智能体将会让弱势群体的信用变得越来越差。

第二，在模拟过程中，机会均等约束(在每一步都在每组间强制实施均等的 TPR)并不能使TRP在总体上均等。这个可能违反直觉的结果可以看作是辛普森悖论的案例之一。

辛普森悖论的案例之一。TP 为真阳性分类，FN 对应假阴性分类，而TPR则是真阳性率。在第1、2年中，借贷者实施能够在两组间实现均等TPR的政策。但两年的TPR总和并没有实现均等TPR。

如上表所示，每两年的均等TPR并不意味着TPR总体均等。这也显示了当潜在人群不断演变时，机会均等指标解释起来会很难，同时也表明非常有必要用更多详细的分析来确保机器学习能产生预期的效果。

上述内容，只讨论了借贷问题，不过据谷歌研究人员表示，ML-fairness-gym 可以用来解决更广泛的公平性问题。在论文中，作者还介绍了其他一些应用场景，感兴趣者可以去阅读论文原文。

ML-fairness-gym 框架在模拟和探索未研究过“公平性”的问题上，也足够灵活。在他们另外的一篇论文《Fair treatment allocations in social networks》(社交网络中的公平待遇分配)中，作者还研究了社交网络中精准疾病控制问题的公平性问题。

阅读全文

人工智能(229987) 人工智能(229987)
机器学习(130423) 机器学习(130423)

分享一些最常见最实用的机器学习算法

在这篇文章中，分享一些最常用的机器学习算法。

2017-10-14 14:24:00

8793

25个机器学习面试题，你都会吗？

问题都没有给出明确的答案，但都有一定的提示。读者也可以在留言中尝试。许多数据科学家主要是从一个数据从业者的角度来研究机器学习（ML）。因此，关于机器学习，我们应该尽可能多地把注意力放在新的程序包、框架、技术

2018-09-29 09:39:54

机器学习算法分享

机器学习算法（1）——Logistic Regression

2020-06-09 13:30:03

机器学习算法如何用于制造无人驾驶汽车？

机器学习算法如何用于制造无人驾驶汽车

2021-03-18 06:27:18

机器学习——期望最大算法

机器学习 - 期望最大（EM）算法

2020-05-21 14:31:34

机器学习之 k-近邻算法(k-NN)

机器学习机器学习100天(5) --- k-近邻算法(k-NN)

2020-05-15 15:06:29

机器学习之高级算法课程学习总结

机器学习：高级算法课程学习总结

2020-05-05 17:17:16

机器学习的算法应用

关于机器学习的相关算法。正版资源，免费看的。

2017-08-24 22:14:36

机器学习简介与经典机器学习算法人才培养

上课时间安排：2022年05月27日 — 2022年05月30日No.1 第一天一、机器学习简介与经典机器学习算法介绍什么是机器学习？机器学习框架与基本组成机器学习的训练步骤机器学习问题的分类

2022-04-28 18:56:07

机器人足球识别算法研究

`机器人足球识别算法研究`

2012-08-20 19:59:14

【下载】《机器学习》+《机器学习实战》

、谋发展的决定性手段，这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。本书第一部分主要介绍机器学习基础，以及如何利用算法进行分类，并逐步介绍了多种经典的监督学习算法，如k近邻算法

2017-06-01 15:49:24

【专辑精选】机器学习之算法教程与资料

电子发烧友总结了以“算法”为主题的精选干货，今后每天一个主题为一期，希望对各位有所帮助！（点击标题即可进入页面下载相关资料）经典算法大全（51个C语言算法+单片机常用算法+机器学十大算法）11种常见

2019-05-09 17:06:40

【阿里云大学免费精品课】机器学习入门：概念原理及常用算法

是实现人工智能的一个途径，即以机器学习为手段解决人工智能中的问题。1.在维基百科中，机器学习有下面几种定义：机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法

2017-06-23 13:51:15

人工智能和机器学习的前世今生

，并将人类决策过程编码成算法。这些算法可以被应用到几个实例以得出有意义的结论。在这篇文章中，我们将了解一些机器学习的基础、工作原理及特点。举例来了解机器学习经研究预测，截至到2020年，企业采用机器学习

2018-08-27 10:16:55

人工智能基本概念机器学习算法

目录人工智能基本概念机器学习算法1. 决策树2. KNN3. KMEANS4. SVM5. 线性回归深度学习算法1. BP2. GANs3. CNN4. LSTM应用人工智能基本概念数据集：训练集

2021-09-06 08:21:17

什么是机器学习? 机器学习基础入门

的、面向任务的智能，这就是机器学习的范畴。我过去听到的机器学习定义的最强大的方法之一是与传统的、用于经典计算机编程的算法方法相比较。在经典计算中，工程师向计算机提供输入数据ーー例如，数字2和4ーー以及将它

2022-06-21 11:06:37

如何去获取Arm Spinlock的公平性呢

　atomic方式，所以没有MESI协议的ping-pong效应，公平性较好，基本上50%.近水楼台先得月和MESI乒乓为了解释公平性其中的原因，需要理解MESI cache一致性协议

2022-08-04 14:46:59

如果只是应用机器学习，而不是研究，需要哪些知识

如果只是应用机器学习，而不是研究，需要哪些知识？还用深入学习数字么

2019-08-30 14:51:02

干货 | 这些机器学习算法，你了解几个？

优胜者。当然，你尝试的算法必须适合你的问题，这就是选择正确的机器学习算法的重要性之所在。打个比方，如果你需要清理你的房子，你可以使用真空吸尘器，扫帚或拖把，但是你不会拿出一把铲子然后开始挖掘。因此

2019-09-22 08:30:00

有没有搞机器学习算法研究的啊？

有没有搞机器学习、人工智能相关的算法研究的啊？自己一个人搞感觉挺难的，希望找到志同道合的朋友，相互探讨。

2016-02-26 09:56:00

有没有搞机器学习，人工智能算法研究的啊？

如题，希望找到一些同样研究机器学习，人工智能算法研究的朋友，相互探讨，共同进步。自己一个人搞感觉挺难的，希望可以一起讨论，跟贴联系。

2016-02-26 09:58:54

本应公平公正的 AI，却从数据中学会了人类的偏见

。但是数据的构成决定了算法将注意力引导到哪里去。多伦多大学计算机科学教授Toniann Pitassi的研究重点是机器学习的公平性，他提供了一个招生计划的例子。Pitassi说：“比方说你有5%的黑人申请

2018-06-02 12:51:50

移动机器人运动控制系统设计及控制算法研究

2012-08-20 15:54:16

经典算法大全（51个C语言算法+单片机常用算法+机器学十大算法）

试题学SPFA算法整体来说，机器学习算法可以分为 3 大类：0.1 监督学习工作原理：该算法由自变量（协变量、预测变量）和因变量（结果变量）组成，由一组自变量对因变量进行预测。通过这些变量集合，我们

2018-10-23 14:31:12

防御机器学习算法对抗欺骗攻击的研究

DARPA与英特尔、乔治亚理工学院合作，开创机器学习“免疫系统”

2020-11-26 07:04:37

高级机器学习算法工程师--【北京】

职位描述：1. 负责计算机视觉&机器学习（包括深度学习）算法的开发与性能提升，负责下述研究课题中的一项或多项，包括但不限于：人脸识别、检测、活体、跟踪、分类、语义分割、深度估计、图像处理

2017-12-07 14:34:41

基于OFDMA资源调度分配算法的研究

针对OFDMA系统的特点，提出了一种按用户数据速率与信道条件进行资源调度分配算法。该算法在满足一定的公平性原则下，根据用户的信道参数与业务需求，动态分配子载波与传输

2009-02-28 16:37:16

高速TCP变种协议与DCCP协议的公平性研究

通过ns-2 仿真，测试4 种主流高速TCP 变种与DCCP 在不同网络环境下的公平性。仿真结果表明，在与DCCP 的公平性方面，4 个变种由优到劣依次为CUBIC, HS-TCP, BIC, STCP。测试结果有助于更全

2009-03-23 08:50:01

一种基于RTT公平性的TCP慢启动算法

分析标准慢启动算法应用于包含GEO 卫星链路的网络时存在的问题，提出一种基于RTT 公平性的TCP 慢启动改进算法。改进算法采用大初始窗口机制，慢启动初期窗口保持指数增长，慢

2009-03-23 08:54:36

弹性分组环中公平算法的参数选择

弹性分组环（Resilient Packet Ring，RPR）是主要用于城域网的新型MAC 协议，已被IEEE 802.17 工作组标准化。公平性是RPR 的关键技术之一。本文着重研究了标准算法中不同算法参数下算

2009-08-26 10:54:56

一种基于速率的公平队列管理算法

针对主动队列管理算法普遍存在的公平性问题，提出基于速率的公平队列管理算法RFED。该算法根据分组的到达速率调节丢包率，将队列的到达速率控制在链路的服务速率下，根据

2009-10-04 14:11:22

基于分层时间有色Petri网的支付协议公平性分析

电子支付协议是一种重要的电子商务协议，公平性是其重要的安全属性之一。该文提出一种基于分层时间有色Petri 网(HTCPN)的电子支付协议形式化分析方法。该方法在进行公平性分析

2009-11-17 13:38:43

基于模糊流感知的动态优先公平调度算法

为适应网络的动态性，提高调度公平性和资源效率，流感知优先公平调度机制需要动态的多业务区分转发。与链路负载状态相关的模糊流感知能够实现路径上的一致性业务区分，而

2009-11-24 14:16:37

一种提高IEEE 802.11吞吐量和公平性的自适应优化算法

该文提出了一种针对IEEE 802.11 DCF网络增强其吞吐量和公平性性能的自适应优化算法，算法基于网络节点侦听信道得到的网络状态信息进行竞争发送的自适应调整以获得最优的网络性

2010-02-10 14:56:35

改进DBTMA协议公平性方案

针对双忙音多址接入协议(DBTMA)在解决AdHoc网络中的隐终端和暴露终端问题时，出现的不公平性问题．提出了一种改进方案．改进方案去掉原协议中的忙音信号发送．采用时隙ALOHA协议对

2011-05-20 16:50:57

一文解析机器学习常用35大算法

本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然，本文收录的算法并不完全，分类的方式也不唯一。

2018-06-30 04:24:00

3645

机器学习经典算法-最优化方法

机器学习算法之最优化方法

2017-09-04 10:05:10

Spark机器学习库的各种机器学习算法

本文将简要介绍Spark机器学习库（Spark MLlibs APIs）的各种机器学习算法，主要包括：统计算法、分类算法、聚类算法和协同过滤算法，以及各种算法的应用。你不是一个数据科学家。根据

2017-09-28 16:44:43

基于邻近点算法的比例公平优化方法

（基于吞吐量的公平性），从而降低网络整体的性能。为了克服这一性能异常问题，基于比例公平的优化由于其吞吐量增强能力已经引起广大的关注。在本文中，提出了一种基于邻近点算法的比例公平优化方法，每个竞争节点根据其链路质量的差异使用不同的接

2017-11-11 10:42:37

异构多核下兼顾应用公平性和能耗的调度方法研究

异构多核处理器通常由高性能的大核和低能耗的小核组成，在其上进行合理的线程调度可以有效地提高资源利用率，节省能耗。之前论文提出的大小核上的公平性调度并没有考虑核上有不同频率／电压状态的情况，而现在支持

2017-11-30 18:07:54

基于最大最小公平性的功率分配算法

针对多个终端直通通信（D2D）用户共享多个蜂窝用户资源的公平性问题，在保证蜂窝用户速率的前提下，提出了基于最大最小公平性（ max-min faimess）的功率分配算法。该算法首先将非凸优化

2017-12-04 11:46:50

基于公平性的D2D时隙调度算法

针对设备到设备（ D2D）通信资源分配中的时隙调度时延以及信道增益变化导致吞吐率下降的问题，提出了一种公平性时隙调度（ FTDS）算法。首先，基于频谱复用模式建立系统模型，并归纳为一组合优化

2017-12-05 16:29:52

云环境下能耗感知的公平性提升资源调度策略

针对云计算环境下大量的能源消耗和一些用户非法占有计算资源的问题，为了节约资源，同时提高系统的公平性，使所有用户能合理地使用数据中心的所有资源，提出一种基于能耗感知的节能公平的资源调度算法

2017-12-11 16:42:54

云环境下公平性优化的资源分配方法

针对云数据中心资源分配不均、效率不高、资源错位等问题，为了满足不同用户的需求，达到多种资源分配的公平性，实现资源的高效利用，提出了全局优势资源公平（ GDRF）分配算法。GDRF算法采用多轮分配

2017-12-11 16:46:48

异构云系统中基于智能优化算法的多维资源公平分配

资源分配策略的研究一直是云计算领域研究的热点和难点，针对异构云计算环境下多维资源的公平分配问题，结合基因算法（GA）和差分进化算法（DE），分别给出了两种兼顾分配公平性和效率的资源分配策略，改进

2017-12-13 17:19:50

Mesos多资源调度DRF增强算法

云计算集群环境下多资源分配的公平性是考量资源调度子系统最重要的指标之一，DRF作为通用的多资源公平分配算法，在异构异质的集群环境下可能有失公平性。在研究Mesos框架中DRF多资源公平分配算法

2017-12-18 10:54:48

面向认知的多源数据学习理论和算法研究进展

多源数据学习在大数据时代具有极其重要的意义，目前，多源数据学习算法研究远远超前于多源数据学习理论研究，经典的机器学习理论难以应用于多源数据学习。更难以提供多源数据学习算法在实际应用中的理论保障

2017-12-26 16:10:41

机器学习算法分类

机器学习起源于人工智能，可以赋予计算机以传统编程所无法实现的能力，比如飞行器的自动驾驶、人脸识别、计算机视觉和数据挖掘等。机器学习的算法很多。很多时候困惑人们的是，很多算法是一类算法，而有些算法又是

2018-01-05 17:36:10

3101

公平高效机会干扰对齐算法

针对干扰对齐的实际应用提出的机会干扰对齐算法（OIA）存在通信资源分配不公平、所需用户基数大等问题。为此，提出一种基于轮询机制的公平高效机会干扰对齐算法。首先确定协作处理簇，并基于轮询机制在主小区

2018-01-08 15:59:38

基于排序学习的推荐算法

排序学习技术尝试用机器学习的方法解决排序问题，已被深入研究并广泛应用于不同的领域，如信息检索、文本挖掘、个性化推荐、生物医学等．将排序学习融入推荐算法中，研究如何整合大量用户和物品的特征，构建更加

2018-01-16 15:50:35

人工智能之机器学习常见算法

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里小编为您总结一下常见的机器学习算法，以供您在工作和学习中参考。

2018-02-02 17:20:46

1552

新手如何接触机器学习的这十大算法一定不能错过

在神经网络的成功的带动下，越来越多的研究人员和开发人员都开始重新审视机器学习，开始尝试用某些机器学习方法自动解决可以轻松采集数据的问题。然而，在众多的机器学习算法中，哪些是又上手快捷又功能强大、适合

2018-03-16 22:39:00

1048

MIMO OFDM系统公平性资源分配算法

系统资源分配过程中信道信息反馈开销过大的问题，给出了一种基于有限反馈的公平性资源分配算法。该算法在发射总功率、目标误码率以及用户间比例速率约束条件下，以最大化系统和容量为目标，将相邻子载波分簇并反馈

2018-03-13 14:44:01

机器学习新手最适合学习的10个算法

算法永远是一段代码的灵魂，面对海量的机器学习算法，萌新最爱问的是，“我该选什么算法？”

2018-03-29 14:10:39

7887

讨论在调整以长期社会福利为目标的机器学习所得决策方面的近期成果

由于机器学习系统容易受到历史数据引入的偏见而导致歧视性行为，人们认为有必要在某些应用场景中用公平性准则约束系统的行为，并期待其能保护弱势群体和带来长期收益。近日，伯克利 AI 研究院发表博客，讨论了静态公平性准则的长期影响，发现结果和人们的期望相差甚远。相关论文已被 ICML 2018 大会接收。

2018-06-04 14:00:00

512

如何使算法公平?如何定义“公平”?

研究算法偏差的研究人员表示，有很多方法可以定义公平，但这些方法有时相互矛盾。想象一下，在刑事司法系统中使用的算法会将分数分配给两组（蓝色组和紫色组），因为它们有被重新逮捕的风险。历史数据表明紫色

2018-08-02 09:53:36

4024

5分钟内看懂机器学习和深度学习的区别

学习的比较外，我们还将研究他们未来的趋势和走向。深度学习与机器学习简介一、什么是机器学习？通常，为了实现人工智能，我们使用机器学习。我们有几种算法用于机器学习。例如： Find-S算法决策树算法（Decision trees）随机森林算法（Random forests）人工神经网络通常

2018-09-13 17:19:01

393

Python基础教程之《Python机器学习—预测分析核心算法》免费下载

　在学习和研究机器学习的时候，面临令人眼花缭乱的算法，机器学习新手往往会不知所措。本书从算法和 Python 语言实现的角度，帮助读者认识机器学习。

2018-09-29 08:00:00

值得研究的四大机器学习策略分析

机器学习有四种广受认可的形式：监督式、无监督式、半监督式和强化式。在研究文献中，这些形式得到了深入的探讨。它们也被纳入了大多数机器学习算法的入门课程。下表对这四种形式作了总结。

2018-11-14 10:17:54

1510

机器学习算法常用指标汇总

机器学习性能评价标准是模型优化的前提，在设计机器学习算法过程中，不同的问题需要用到不同的评价标准，本文对机器学习算法常用指标进行了总结。

2019-02-13 15:09:19

3945

亚马逊与科学基金会合作,专注于开发AI和机器学习公平性的系统

导语：亚马逊与国家科学基金会合作，投资千万美金开发AI公平性系统，实现人工智能系统更广泛的接受度。

2019-03-27 11:47:21

1811

亚马逊专注于AI的公平性研究

亚马逊今日宣布，将与美国国家科学基金会（NSF）合作，未来三年最多将投入1000万美元的研究资金，重点放在人工智能和机器学习的公平性上。

2019-03-29 09:37:49

2844

机器学习十大算法精髓总结

最常见的机器学习算法是学习映射Y = f(X)来预测新X的Y，这叫做预测建模或预测分析。

2019-05-05 09:21:00

3474

RNN正在失去光芒强化学习仍最受欢迎

为期4天的会议，共有8个邀请演讲主题，内容包括：算法公平性的进展、对抗机器学习、发展自主学习：人工智能，认知科学和教育技术、用神经模型学习自然语言界面等等。

2019-05-17 17:25:08

3650

谷歌发布非政策强化学习算法OPC的最新研究机器学习即将开辟新篇章？

在谷歌最新的论文中，研究人员提出了“非政策强化学习”算法OPC，它是强化学习的一种变体，它能够评估哪种机器学习模型将产生最好的结果。数据显示，OPC比基线机器学习算法有着显著的提高，更加稳健可靠。

2019-06-22 11:17:08

3374

详解机器学习分类算法KNN

本文主要介绍一个被广泛使用的机器学习分类算法，K-nearest neighbors（KNN），中文叫K近邻算法。

2019-10-31 17:18:14

5657

人工智能的算法公平性实现

我们解决了算法公平性的问题:确保分类器的结果不会偏向于敏感的变量值，比如年龄、种族或性别。由于一般的公平性度量可以表示为变量之间(条件)独立性的度量，我们提出使用Renyi最大相关系数将公平性度量推广到连续变量。

2019-11-06 17:04:05

2395

人人都能懂的机器学习算法原理教程免费下载

算法公式挺费神，机器学习太伤人。任何一个刚入门机器学习的人都会被复杂的公式和晦涩难懂的术语吓到。但其实，如果有通俗易懂的图解，理解机器学习的原理就会非常容易。本文整理了一篇博客文章的内容，读者可根据这些图理解看似高深的机器学习算法。

2020-05-21 08:00:00

机器学习算法已成为攻克医疗难疾的新救星

由剑桥大学领导的研究人员设计了一种用于药物发现的机器学习算法，该算法的效率是工业标准的两倍，可以加快开发新的疾病治疗方法的进程。

2020-05-28 09:04:51

563

理解机器学习中的算法与模型

对于初学者来说，这很容易让人混淆，因为“机器学习算法”经常与“机器学习模型”交替使用。这两个到底是一样的东西呢，还是不一样的东西？作为开发人员，你对排序算法、搜索算法等“算法”的直觉，将有助于你厘清这个困惑。在本文中，我将阐述机器学习“算法”和“模型”之间的区别。

2020-07-31 15:38:08

3347

机器学习的范围和算法

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2020-11-12 10:19:12

1203

机器学习的范围/算法/分类

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2021-01-21 09:29:06

3315

最实用的的五种机器学习算法

最实用的机器学习算法Top5 demi 在周一, 04/01/2019 - 10:35 提交本文将推荐五种机器学习算法，你应该考虑是否将它们投入应用。这五种算法覆盖最常用于聚类、分类、数值预测

2021-03-24 16:14:31

5987

Python机器学习应用

机器学习的目标：机器学习是实现人工智能的手段，主要研究内容是如何利用数据或经验进行学习，改善具体算法性能。

2021-05-25 16:24:58

下行非正交多址接入系统的公平资源分配算法

针对下行非正交多址接入系统多用户场景，综合考虑吞吐量、服务质量、公平性、串行干扰消除（SIC）能力等因素，提出一种基于比例速率约束的公平资源分配算法。利用比例公平思想设计自适应比例公平用户配对

2021-05-28 11:38:49

机器学习模型在功耗分析攻击中的研究

不同的数据集的十折交叉验证结果进行模型选择，提高测试公平性及测试结果的泛化能力。为避免十折交叉验证过程中出现测试集误差不足以近似泛化误差的问题，采用 Fried man检验及 Nemeny后续检验相结合的方法对4种机器学习算法进行评估

2021-06-03 15:53:58

基于机器学习的哈希检索算法综述

2021-06-10 11:05:56

浅析机器学习必学10大算法及8种降维技术

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身

2022-01-30 17:14:00

956

将道德内容加载到机器学习中学会批判性地思考机器学习

和模型偏差以及机器学习公平性相关的材料。参加 MIT 课程 6.036（机器学习简介）的学生学习强大模型背后的原理，这些模型可帮助医生诊断疾病或帮助招聘人员筛选求职者。现在，由于计算的社会和道德责任（SERC）框架，这些学生还

2022-04-18 18:52:21

1367

机器学习和深度学习算法流程

但是无可否认的是深度学习实在太好用啦！极大地简化了传统机器学习的整体算法分析和学习流程，更重要的是在一些通用的领域任务刷新了传统机器学习算法达不到的精度和准确率。

2022-04-26 15:07:20

4084

17个机器学习的常用算法

根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法，这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。

2022-08-11 11:20:17

1399

17个机器学习的常用算法！

源自：AI知识干货根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错

2022-08-22 09:57:33

1446

机器学习算法的基础介绍

现在，机器学习有很多算法。如此多的算法，可能对于初学者来说，是相当不堪重负的。今天，我们将简要介绍 10 种最流行的机器学习算法，这样你就可以适应这个激动人心的机器学习世界了！

2022-10-24 10:08:42

1518

机器学习算法的随机数据生成简析

在学习机器学习算法的过程中，我们经常需要数据来验证算法，调试参数。

2023-03-15 09:07:48

360

机器学习的经典算法与应用

一、机器学习基础概念关于数据机器学习就是喂入算法和数据，让算法从数据中寻找一种相应的关系。 Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据

2023-05-28 11:29:41

652

基于机器学习算法的校准优化方案

2023-06-29 12:35:49

236

智能数字辨识水表-基于机器学习算法

智智能数字辨识水表-基于机器学习算法

2023-08-10 11:26:40

371

机器学习算法的5种基本算子

机器学习算法的5种基本算子机器学习是一种重要的人工智能技术，它是为了让计算机能够通过数据自主的学习和提升能力而发明的。机器学习算法是机器学习的核心，它是指让计算机从数据中进行自主学习并且可以实现

2023-08-17 16:11:46

1245

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法汇总机器学习算法分类机器学习算法模型机器学习是人工智能的分支之一，它通过分析和识别数据模式，学习从中提取规律，并用于未来的决策和预测。在机器学习中，算法是最基本的组成部分之一。算法

2023-08-17 16:11:48

632

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器学习算法优缺点? 机器学习算法总结机器学习算法是一种能够从数据中自动学习的算法。它能够从训练数据中学习特征，进而对未知数据进行分类、回归、聚类等任务。通过

2023-08-17 16:11:50

939

机器学习算法入门机器学习算法介绍机器学习算法对比

机器学习算法入门机器学习算法介绍机器学习算法对比机器学习算法入门、介绍和对比随着机器学习的普及，越来越多的人想要了解和学习机器学习算法。在这篇文章中，我们将会简单介绍机器学习算法的基本概念

2023-08-17 16:27:15

569

机器学习vsm算法

机器学习vsm算法随着机器学习技术的不断发展，相似性计算是机器学习中的重要组成部分。在信息检索、文本挖掘、机器翻译等领域中，相似性计算是必不可少的一项技术。在这些领域中，我们通常使用向量空间模型

2023-08-17 16:29:35

529

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？机器学习是一种人工智能技术，通过对数据的分析和学习，为计算机提供智能决策。机器学习算法是实现机器学习的基础。常见的机器学习算法

2023-08-17 16:30:11

1245

机器学习的研究现状和发展趋势机器学习的常见算法和优缺点

随着计算能力和大数据的崛起，机器学习算法正迎来快速发展的时期。在研究层面上，机器学习和深度学习是当前最主要的热点。在计算能力的推动下，机器学习算法取得了许多重大突破，如AlphaGo战胜人类棋手

2023-08-22 17:49:27

1659

Harvard FairSeg：第一个用于医学分割的公平性数据集

为了解决这些挑战，我们提出了第一个大规模医学分割领域的公平性数据集， Harvard-FairSeg。该数据集旨在用于研究公平性的cup-disc segmentation，从SLO眼底图像中诊断青光眼，如图1所示。

2024-01-25 16:52:09

230

已全部加载完成

搜索历史

对机器学习算法公平性的研究

评论