机器学习CART算法

导读：人工智能机器学习有关算法内容，今天我们重点探讨一下CART算法。

继上两篇决策树算法之ID3算法和ID3的改进算法－C4．5算法后，本文继续讨论另一种二分决策树算法－CART算法。我们知道十大机器学习中决策树算法占有两席位置，即C4．5算法和CART算法，可见CART算法的重要性。下面重点介绍CART算法。

不同于ID3与C4．5，CART为一种二分决策树，是满二叉树。CART算法由Breiman等人在 1984 年提出，它采用与传统统计学完全不同的方式构建预测准则，它是以二叉树的形式给出，易于理解、使用和解释。由CART 模型构建的预测树在很多情况下比常用的统计方法构建的代数学预测准则更加准确，且数据越复杂、变量越多，算法的优越性就越显著。

CART算法既可用于分类也可用于回归。CART算法被称为数据挖掘领域内里程碑式的算法。

CART算法概念：

CART（Classification andRegression Tree）分类回归树是一种决策树构建算法。CART是在给定输入随机变量X条件下输出随机变量Y的条件概率分布的学习方法。CART假设决策树是二叉树，内部结点特征的取值为“是”和“否”，左分支是取值为“是”的分支，右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征，将输入空间即特征空间划分为有限个单元，并在这些单元上确定预测的概率分布，也就是在输入给定的条件下输出的条件概率分布。

CART算法既可以处理离散型问题，也可以处理连续型问题。这种算法在处理连续型问题时，主要通过使用二元切分来处理连续型变量，即特征值大于某个给定的值就走左子树，或者就走右子树。

CART算法组成：

1）决策树生成：基于训练数据集生成决策树，生成的决策树要尽量大；自上而下从根开始建立节点，在每个节点处要选择一个最好（不同算法使用不同指标来定义＂最好＂）的属性来分裂，使得子节点中的训练数据集尽量的纯。

2）决策树剪枝：用验证数据集对已生成的树进行剪枝并选择最优子树，这时损失函数最小作为剪枝的标准。这里用代价复杂度剪枝CCP（Cost－Complexity Pruning）。

决策树的生成就是通过递归地构建二叉决策树的过程，对回归树用平方误差最小化准则，对分类树用基尼指数最小化准则，进行特征选择，生成二叉树。

CART决策树生成：

1）回归树生成

回归树采用均方误差作为损失函数，树生成时会递归的按最优特征与最优特征下的最优取值对空间进行划分，直到满足停止条件为止，停止条件可以人为设定，比如当切分后的损失减小值小于给定的阈值 ε，则停止切分，生成叶节点。对于生成的回归树，每个叶节点的类别为落到该叶节点数据的标签的均值。

回归树为一棵二叉树，每次都是按特征下的某个取值进行划分，每一个内部节点都是做一个对应特征的判断，直至走到叶节点得到其类别，构建这棵树的难点在于如何选取最优的切分特征与切分特征对应的切分变量。

回归树与模型树既可以处理连续特征也可以处理离散特征。

回归树生成算法如下：

输入：训练数据集 D＝｛（x1，y1），（x2，y2），…，（xN，yN）｝

输出：回归树 T

1）求解选择切分特征 j 与切分特征取值 s ，j 将训练集 D 划分为两部分，R1 与R2 ，依照（j，s）切分后如下：

R1（j，s）＝｛xi｜xji≤s｝ R2（j，s）＝｛xi｜xji＞s｝

c1＝1N1∑xi∈R1yi c2＝1N2∑xi∈R2yi

2）遍历所有可能的解（j，s），找到最优的（j＊，s＊），最优的解使得对应损失最小，按照最优特征（j＊，s＊）来切分即可。

Min ｛ ∑ （yi–c1）＾2 ＋∑ （yi–c2）＾2 ｝

j，s xi∈R1 xi∈R2

3）递归调用 1）和2），直到满足停止条件。

4）返回决策树 T。

回归树主要采用了分治策略，对于无法用唯一的全局线性回归来优化的目标进行分而治之，进而取得比较准确的结果，但分段取均值并不是一个明智的选择，可以考虑将叶节点设置为一个线性函数，这便是所谓的分段线性模型树。实验表明：模型树效果比回归树的效果要好一些。模型树只需在回归树的基础上稍加修改即可，对于分到叶节点的数据，采用线性回归的最小均方损失来计算该节点的损失。

2）分类树生成

分类树是CART中用来分类的，不同于 ID3 与 C4．5，CART分类树采用基尼指数来选择最优的切分特征，而且每次都是二分。

基尼指数是一个类似与熵的概念，对于一个有 K 种状态对应的概率为 p1，p2，…，pK的随机变量 X ，其基尼指数Gini定义如下：

Gini（X）＝∑pk（1？pk）＝1？∑kp2k

k k

在已知特征 A条件下集合 D 的基尼指数：

Gini（D，A）＝（｜D1｜／｜D｜）＊Gini（D1）＋（｜D2｜／｜D｜）＊Gini（D2）

Gini（D，A）取值越大，样本的不确定性也越大，这一点与熵类似，所以选择特征 A 的标准是 Gini（D，A）的取值越小越好。

分类树生成算法如下：

输入：训练数据集 D＝｛（x1，y1），（x2，y2），…，（xN，yN）｝，停止条件

输出：分类树 T

1）利用特征 A 的取值 a 将数据分为两部分，计算 A＝a时的基尼系数：

Gini（D，A）＝（｜D1｜／｜D｜）＊Gini（D1）＋（｜D2｜／｜D｜）＊Gini（D2）

2）对整个数据集中所有的可能特征 A 以及其可能取值 a 选取基尼系数最小的特征 A＊与特征下的取值 a＊，来将数据集切分，将数据 D1、D2 分到两个子节点中去。

3）对子节点递归调用 1）和2），直至满足停止条件

4）返回 CART 树 T

该算法停止条件可以是节点中的样本数不能小于给定阈值，或者样本集的基尼系数小于给定阈值，或者没有更多的特征。

3）剪枝

CART需要对生成的树进行剪枝，避免模型过度拟合训练数据，剪枝时使用的损失函数如下：

Ca（T）＝C（T）＋a｜T｜

C（T）为树 T 对训练数据的误差，可以用基尼系数或者均方损失来表示，a≥0 代表一个权衡训练数据损失 C（T）与总节点数｜T｜的参数，Ca（T）代表了树 T 的整体损失，对于固定的 a，一定存在一个确定的使得 Ca（T）最小的子树，当 a偏大时，｜T｜偏小，树 T 的规模偏小，反之，树 T 的规模偏大，Breiman 等人采用递归的方法对 CART 进行剪枝，将 a从小增大 0＝a0＜a1＜…＜an，如此产生的区间 a∈［ai，ai＋1）， i＝1，2，…，n用对应此区间的 a 产生一系列的子树序列｛T0，T1，…，Tn｝这里 Ti＋1总是由 Ti 剪枝后产生。

剪枝算法如下：

输入：CART 生成树 T0

输出：剪枝后的最优树 T＊

1）设 k＝0 ， T＝T0 ，a＝＋∞

3）自下而上的对内部节点 t 计算：

g（t）＝［Ct？C（Tt）］／（｜Tt｜？1）

a＝min（a，g（t））

4）自上而下的访问内部节点 t ，对最小的 g（t）＝a进行剪枝，并对叶节点 t 以多数表决形式决定其类别，得到树 T

5） k＝k＋1， ak＝a，Tk＝T

6）如果 T 为非单节点树，回到4）

7）对于产生的子树序列｛T0，T1，…，Tn｝分别计算损失，得到最优子树 T＊并返回．

剪枝后的树便是所需要的CART决策树。

CART优点：

1）可以生成可以理解的规则；

2）计算量相对来说不是很大；

3）可以处理连续和种类字段；

4）决策树可以清晰的显示哪些字段比较重要。

CART缺点：

1）对连续性的字段比较难预测；

2）对有时间顺序的数据，需要很多预处理的工作；

3）当类别太多时，错误可能就会增加的比较快；

4）一般的算法分类的时候，只是根据一个字段来分类。

CART应用场景：

CART算法既可以处理离散型问题，也可以处理连续型问题。CART算法是一种非常有趣且十分有效的非参数分类和回归方法。它通过构建二叉树达到预测目的。它已在统计、数据挖掘和机器学习领域中普遍使用，是一种应用广泛的决策树算法。

结语：

CART模型最早由Breiman 等人提出，它采用与传统统计学完全不同的方式构建预测准则，它是以二叉树形式给出，易于理解、使用和解释。由CART 模型构建的预测树在很多情况下比常用的统计方法构建的代数学预测准则更加准确，且数据越复杂、变量越多，CART算法优越性就越显著。模型的关键是预测准则的构建。CART算法在统计、数据挖掘和机器学习等领域得到广泛应用。

阅读全文

算法(90512) 算法(90512)
人工智能(229987) 人工智能(229987)
决策树(13339) 决策树(13339)

机器学习算法盘点：人工神经网络、深度学习

机器学习的算法很多。很多时候困惑人们都是，很多算法是一类算法，而有些算法又是从其他算法中延伸出来的。这里，我们从两个方面来给大家介绍，第一个方面是学习的方式，第二个方面是算法的类似性。

2016-08-01 16:26:33

5013

分享一些最常见最实用的机器学习算法

在这篇文章中，分享一些最常用的机器学习算法。

2017-10-14 14:24:00

8793

机器学习算法概念介绍及选用建议

在从事数据科学工作的时候，经常会遇到为具体问题选择最合适算法的问题。虽然有很多有关机器学习算法的文章详细介绍了相关的算法，但要做出最合适的选择依然非常困难。

2019-01-14 13:49:42

3562

机器学习技术在图像处理中的应用

在本章中，我们将讨论机器学习技术在图像处理中的应用。首先，定义机器学习，并学习它的两种算法——监督算法和无监督算法；其次，讨论一些流行的无监督机器学习技术的应用，如聚类和图像分割等问题。

2022-10-18 16:08:02

1853

机器学习算法分享

机器学习算法（1）——Logistic Regression

2020-06-09 13:30:03

机器学习算法如何用于制造无人驾驶汽车？

机器学习算法如何用于制造无人驾驶汽车

2021-03-18 06:27:18

机器学习——期望最大算法

机器学习 - 期望最大（EM）算法

2020-05-21 14:31:34

机器学习之 k-近邻算法(k-NN)

机器学习机器学习100天(5) --- k-近邻算法(k-NN)

2020-05-15 15:06:29

机器学习之高级算法课程学习总结

机器学习：高级算法课程学习总结

2020-05-05 17:17:16

机器学习工程师必知的10大算法

`转一篇好资料机器学习算法可以分为三大类：监督学习、无监督学习和强化学习。监督学习可用于一个特定的数据集（训练集）具有某一属性（标签），但是其他数据没有标签或者需要预测标签的情况。无监督学习可用

2017-04-18 18:28:36

机器学习的算法应用

关于机器学习的相关算法。正版资源，免费看的。

2017-08-24 22:14:36

机器学习的创新/开发和应用能力

机器学习的未来在工业领域采用机器学习机器学习和大数据工业人工智能生态系统

2020-12-16 07:47:35

机器学习的未来

机器学习的未来在工业领域采用机器学习机器学习和大数据

2021-01-27 06:02:18

机器学习简介与经典机器学习算法人才培养

上课时间安排：2022年05月27日 — 2022年05月30日No.1 第一天一、机器学习简介与经典机器学习算法介绍什么是机器学习？机器学习框架与基本组成机器学习的训练步骤机器学习问题的分类

2022-04-28 18:56:07

机器算法学习比较

转本文主要回顾下几个常用算法的适应场景及其优缺点！机器学习算法太多了，分类、回归、聚类、推荐、图像识别领域等等，要想找到一个合适算法真的不容易，所以在实际应用中，我们一般都是采用启发式学习方式来实验

2016-09-27 10:48:01

ML之ECS：利用ECS的PAI进行傻瓜式操作机器学习的算法

2018-12-20 10:42:02

【下载】《机器学习》+《机器学习实战》

、谋发展的决定性手段，这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。本书第一部分主要介绍机器学习基础，以及如何利用算法进行分类，并逐步介绍了多种经典的监督学习算法，如k近邻算法

2017-06-01 15:49:24

【专辑精选】机器学习之算法教程与资料

电子发烧友总结了以“算法”为主题的精选干货，今后每天一个主题为一期，希望对各位有所帮助！（点击标题即可进入页面下载相关资料）经典算法大全（51个C语言算法+单片机常用算法+机器学十大算法）11种常见

2019-05-09 17:06:40

【阿里云大学免费精品课】机器学习入门：概念原理及常用算法

摘要：阿里云大学联合蚂蚁金服高级算法专家推出了免费的机器学习入门课程：机器学习入门：概念原理及常用算法（点击开始学习） AlaphaGo与围棋界的较量，吸引了全世界的目光，也让大家见识到了机器

2017-06-23 13:51:15

人工智能和机器学习的前世今生

，并将人类决策过程编码成算法。这些算法可以被应用到几个实例以得出有意义的结论。在这篇文章中，我们将了解一些机器学习的基础、工作原理及特点。举例来了解机器学习经研究预测，截至到2020年，企业采用机器学习

2018-08-27 10:16:55

人工智能基本概念机器学习算法

目录人工智能基本概念机器学习算法1. 决策树2. KNN3. KMEANS4. SVM5. 线性回归深度学习算法1. BP2. GANs3. CNN4. LSTM应用人工智能基本概念数据集：训练集

2021-09-06 08:21:17

什么是机器学习? 机器学习基础入门

的、面向任务的智能，这就是机器学习的范畴。我过去听到的机器学习定义的最强大的方法之一是与传统的、用于经典计算机编程的算法方法相比较。在经典计算中，工程师向计算机提供输入数据ーー例如，数字2和4ーー以及将它

2022-06-21 11:06:37

基于决策树的CART算法识别印第安人糖尿病患者

利用决策树中CART算法识别印第安人糖尿病患者

2019-05-06 12:16:27

如何在STM板上使用机器学习算法对通过工业传感器获取的气体传感器数据进行分类？

我想在 STM 板上使用机器学习算法对通过工业传感器获取的气体传感器数据进行分类。知道哪种 STM32 变体最适合此应用吗？

2023-01-10 07:10:16

常用python机器学习库盘点

现在人工智能非常火爆，机器学习应该算是人工智能里面的一个子领域，而其中有一块是对文本进行分析，对数据进行深入的挖掘提取一些特征值，然后用一些算法去学习,训练,分析,甚至还能预测，那么Python中常

2018-05-10 15:20:21

干货 | 这些机器学习算法，你了解几个？

机器学习算法的分类是棘手的，有几种合理的分类，他们可以分为生成/识别，参数/非参数，监督/无监督等。例如，Scikit-Learn的文档页面通过学习机制对算法进行分组。这产生类别如：1

2019-09-22 08:30:00

有没有搞机器学习算法研究的啊？

有没有搞机器学习、人工智能相关的算法研究的啊？自己一个人搞感觉挺难的，希望找到志同道合的朋友，相互探讨。

2016-02-26 09:56:00

经典算法大全（51个C语言算法+单片机常用算法+机器学十大算法）

试题学SPFA算法整体来说，机器学习算法可以分为 3 大类：0.1 监督学习工作原理：该算法由自变量（协变量、预测变量）和因变量（结果变量）组成，由一组自变量对因变量进行预测。通过这些变量集合，我们

2018-10-23 14:31:12

防御机器学习算法对抗欺骗攻击的研究

DARPA与英特尔、乔治亚理工学院合作，开创机器学习“免疫系统”

2020-11-26 07:04:37

高级机器学习算法工程师--【北京】

职位描述：1. 负责计算机视觉&机器学习（包括深度学习）算法的开发与性能提升，负责下述研究课题中的一项或多项，包括但不限于：人脸识别、检测、活体、跟踪、分类、语义分割、深度估计、图像处理

2017-12-07 14:34:41

基于人工情感的Q_学习算法在机器人行为决策中的应用_谷学静

2017-01-12 19:56:23

CART算法在国际贸易预警中的应用_郭义豪

CART算法在国际贸易预警中的应用_郭义豪

2017-03-19 11:26:54

一文详解机器学习工程师必知的10大算法

Netflix的算法可以根据你以前看过的电影来进行电影推荐，而Amazon的算法则可以根据你以前买过的书来推荐书籍。所以如果你想了解更多有关机器学习的内容，那么你该如何入门？

2018-07-08 11:05:00

1536

一文解析机器学习常用35大算法

本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然，本文收录的算法并不完全，分类的方式也不唯一。

2018-06-30 04:24:00

3645

机器学习经典算法-最优化方法

机器学习算法之最优化方法

2017-09-04 10:05:10

Spark机器学习库的各种机器学习算法

本文将简要介绍Spark机器学习库（Spark MLlibs APIs）的各种机器学习算法，主要包括：统计算法、分类算法、聚类算法和协同过滤算法，以及各种算法的应用。你不是一个数据科学家。根据

2017-09-28 16:44:43

R语言机器学习算法的性能分析比较

你如何有效地计算出不同机器学习算法的估计准确性？在这篇文章中，你将会学到8种技术，用来比较R语言机器学习算法。你可以使用这些技术来选择最精准的模型，并能够给出统计意义方面的评价，以及相比其它算法

2017-10-12 16:33:39

系统机器学习算法总结知识分享

Statsbot数据科学家Daniil Korbut简明扼要地介绍了用于推荐系统的主流机器学习算法：协同过滤、矩阵分解、聚类、深度学习。

2017-12-15 14:11:28

4498

机器学习分类算法中必须要懂的四种算法

本文主要介绍了4 种应用比较普遍的的机器学习算法，但是机器学习算法还有其他很多不同的算法，大家感兴趣的可以自己去了解。朴素贝叶斯分类是基于贝叶斯定理与特征条件独立假设的分类方法，发源于古典数学理论，拥有稳定的数学基础和分类效率。

2017-12-26 14:45:02

26224

机器学习算法分类

机器学习起源于人工智能，可以赋予计算机以传统编程所无法实现的能力，比如飞行器的自动驾驶、人脸识别、计算机视觉和数据挖掘等。机器学习的算法很多。很多时候困惑人们的是，很多算法是一类算法，而有些算法又是

2018-01-05 17:36:10

3101

人工智能之机器学习常见算法

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里小编为您总结一下常见的机器学习算法，以供您在工作和学习中参考。

2018-02-02 17:20:46

1552

新手如何接触机器学习的这十大算法一定不能错过

在神经网络的成功的带动下，越来越多的研究人员和开发人员都开始重新审视机器学习，开始尝试用某些机器学习方法自动解决可以轻松采集数据的问题。然而，在众多的机器学习算法中，哪些是又上手快捷又功能强大、适合

2018-03-16 22:39:00

1048

机器学习新手最适合学习的10个算法

算法永远是一段代码的灵魂，面对海量的机器学习算法，萌新最爱问的是，“我该选什么算法？”

2018-03-29 14:10:39

7887

关于机器学习PCA算法的主成分分析

人工智能机器学习有关算法内容，人工智能之机器学习主要有三大类：1）分类；2）回归；3）聚类。今天我们重点探讨一下PCA算法。 PCA（主成分分析）是十大经典机器学习算法之一。PCA是Pearson在1901年提出的，后来由Hotelling在1933年加以发展提出的一种多变量的统计方法。

2018-06-27 17:23:00

2985

经典的机器学习算法汇总

本文将用一句话来总结每种典型的机器学习算法，帮你抓住问题的本质，强化理解和记忆。

2018-08-11 10:24:15

5500

总结机器学习小白必学的10种算法

在机器学习中，有一种叫做「没有免费的午餐」的定理。简而言之，它指出没有任何一种算法对所有问题都有效，在监督学习(即预测建模)中尤其如此。

2018-08-24 10:51:07

5514

人工智能之机器学习CART算法解析

CART（Classification andRegression Tree）分类回归树是一种决策树构建算法。CART是在给定输入随机变量X条件下输出随机变量Y的条件概率分布的学习方法。CART

2018-09-05 10:00:00

4368

机器学习算法基本概念及选用指南

本文对机器学习的一些基本概念给出了简要的介绍，并对不同任务中使用不同类型的机器学习算法给出一点建议。

2019-01-15 15:55:15

2420

机器学习算法常用指标汇总

机器学习性能评价标准是模型优化的前提，在设计机器学习算法过程中，不同的问题需要用到不同的评价标准，本文对机器学习算法常用指标进行了总结。

2019-02-13 15:09:19

3945

如何帮你的回归问题选择最合适的机器学习算法

回归分析在机器学习领域应用非常广泛，例如，商品的销量预测问题，交通流量预测问题。那么，如何为这些回归问题选择最合适的机器学习算法呢？

2019-05-03 09:39:00

2571

机器学习十大算法精髓总结

最常见的机器学习算法是学习映射Y = f(X)来预测新X的Y，这叫做预测建模或预测分析。

2019-05-05 09:21:00

3474

详解机器学习分类算法KNN

本文主要介绍一个被广泛使用的机器学习分类算法，K-nearest neighbors（KNN），中文叫K近邻算法。

2019-10-31 17:18:14

5657

十大机器学习算法中的线性判别分析的详细介绍

先前呢，我们在最受欢迎的十大机器学习算法-part1和最受欢迎的十大机器学习算法-part2两篇文章中简单介绍了十种机器学习算法，有的读者反映看完还是云里雾里，所以，我会挑几种难理解的算法详细讲解一下，今天我们介绍的是线性判别分析。

2020-02-03 07:28:18

6973

各类机器学习分类算法的优点与缺点分析

机器学习中有许多分类算法。本文将介绍分类中使用的各种机器学习算法的优缺点，还将列出他们的应用范围。

2020-03-02 09:50:12

3298

机器学习的十大经典算法有哪些

C4.5算法是机器学习算法中的一种分类决策树算法其核心算法是ID3算法.C4.5算法继承了ID3算法的优点，并在以下几方面对ID3算法进行了改进：1)用信息增益率来选择属性，克服了用信息增益选择属性时偏向选择取值多的属性的不足。

2020-04-25 08:00:00

人人都能懂的机器学习算法原理教程免费下载

算法公式挺费神，机器学习太伤人。任何一个刚入门机器学习的人都会被复杂的公式和晦涩难懂的术语吓到。但其实，如果有通俗易懂的图解，理解机器学习的原理就会非常容易。本文整理了一篇博客文章的内容，读者可根据这些图理解看似高深的机器学习算法。

2020-05-21 08:00:00

理解机器学习中的算法与模型

对于初学者来说，这很容易让人混淆，因为“机器学习算法”经常与“机器学习模型”交替使用。这两个到底是一样的东西呢，还是不一样的东西？作为开发人员，你对排序算法、搜索算法等“算法”的直觉，将有助于你厘清这个困惑。在本文中，我将阐述机器学习“算法”和“模型”之间的区别。

2020-07-31 15:38:08

3347

了解机器学习的十大算法

在机器学习领域，有种说法叫做“世上没有免费的午餐”，简而言之，它是指没有任何一种算法能在每个问题上都能有最好的效果，这个理论在监督学习方面体现得尤为重要。

2020-07-31 16:06:10

854

机器学习算法使用机器来了解给定的数据集

机器学习一词经常与AI互换使用，尽管有明显的区别。机器学习算法使用机器来了解给定的数据集。机器学习的一个子集包括深度学习，它在网络安全领域显示出了巨大的希望

2020-09-16 17:05:24

1980

机器学习的范围和算法

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2020-11-12 10:19:12

1203

10大常用机器学习算法汇总

本文介绍了10大常用机器学习算法，包括线性回归、Logistic回归、线性判别分析、朴素贝叶斯、KNN、随机森林等。

2020-11-20 11:10:04

2462

机器学习的范围/算法/分类

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2021-01-21 09:29:06

3315

最实用的的五种机器学习算法

最实用的机器学习算法Top5 demi 在周一, 04/01/2019 - 10:35 提交本文将推荐五种机器学习算法，你应该考虑是否将它们投入应用。这五种算法覆盖最常用于聚类、分类、数值预测

2021-03-24 16:14:31

5987

详谈机器学习模型算法的质量保障方案

近年来，机器学习模型算法在越来越多的工业实践中落地。在滴滴，大量线上策略由常规算法迁移到机器学习模型算法。如何搭建机器学习模型算法的质量保障体系成为质量团队急需解决的问题之一。本文整体介绍了机器学习模型算法的质量保障方案，并进一步给出了滴滴质量团队在机器学习模型效果评测方面的部分探索实践。

2021-05-05 17:08:00

2010

机器学习可靠性与算法优化

机器学习可靠性与算法优化教材免费下载。

2021-05-19 09:39:29

基于机器学习的哈希检索算法综述

2021-06-10 11:05:56

关于机器学习的十大经典算法

C4.5算法是机器学习算法中的一种分类决策树算法，其核心算法是ID3算法.C4.5算法继承了ID3算法的优点，并在以下几方面对ID3算法进行了改进。

2021-06-23 09:45:25

基于DNN与规则学习的机器翻译算法综述

2021-06-29 15:44:06

浅析机器学习必学10大算法及8种降维技术

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身

2022-01-30 17:14:00

956

机器学习和深度学习算法流程

但是无可否认的是深度学习实在太好用啦！极大地简化了传统机器学习的整体算法分析和学习流程，更重要的是在一些通用的领域任务刷新了传统机器学习算法达不到的精度和准确率。

2022-04-26 15:07:20

4084

17个机器学习的常用算法

根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法，这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。

2022-08-11 11:20:17

1399

17个机器学习的常用算法！

源自：AI知识干货根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错

2022-08-22 09:57:33

1445

机器学习算法的基础介绍

现在，机器学习有很多算法。如此多的算法，可能对于初学者来说，是相当不堪重负的。今天，我们将简要介绍 10 种最流行的机器学习算法，这样你就可以适应这个激动人心的机器学习世界了！

2022-10-24 10:08:42

1518

怎样使用Bevy和dfdx解决经典的Cart Pole问题呢

解决经典的 Cart Pole 问题有很多种, 作者这里借用 dfdx 这个深度学习的库, 使用 Deep Q-Learning 的方法来解决。

2022-10-26 09:39:21

453

机器学习领域将算法按照学习方式分类进行问题解决

2022-11-22 10:40:53

599

常用机器学习算法的基本概念和特点

没有哪一种算法能够适用所有情况，只有针对某一种问题更有用的算法。机器学习算法不会要求一个问题被 100%求解，取而代之的是把问题转化为最优化的问题，用不同的算法优化问题，从而比较得到尽量好的结果

2023-01-17 15:43:09

2979

机器学习算法的随机数据生成简析

在学习机器学习算法的过程中，我们经常需要数据来验证算法，调试参数。

2023-03-15 09:07:48

360

如何评估机器学习模型的性能？机器学习的算法选择

如何评估机器学习模型的性能？典型的回答可能是：首先，将训练数据馈送给学习算法以学习一个模型。第二，预测测试集的标签。第三，计算模型对测试集的预测准确率。

2023-04-04 14:15:19

549

机器学习算法学习之特征工程1

特征工程是机器学习过程中的关键步骤，涉及将原始数据转换为机器学习算法可以有效使用的格式。在本篇博客文章中，我们介绍了各种特征工程技术，包括特征选择和提取、编码分类变量、缩放和归一化、创建新特征、处理不平衡数据、处理偏斜和峰度、处理稀有类别、处理时间序列数据、特征转换和文本预处理。

2023-04-19 11:38:43

519

机器学习算法学习之特征工程2

2023-04-19 11:38:47

560

机器学习算法学习之特征工程3

2023-04-19 11:38:51

703

人工智能、算法与机器学习辨析

人工智能 (AI)、机器学习 (ML) 和算法这几个词经常出现误用、混淆和误解。尽管它们都有各自的固定含义，但是人们常常会将这几个概念互换使用。遗憾的是，如果没有领会这些含义，它们可能会让本已

2023-05-09 10:55:18

1284

机器学习的经典算法与应用

一、机器学习基础概念关于数据机器学习就是喂入算法和数据，让算法从数据中寻找一种相应的关系。 Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据

2023-05-28 11:29:41

652

机器学习理论：k近邻算法

KNN(k-Nearest Neighbors)思想简单，应用的数学知识几乎为0，所以作为机器学习的入门非常实用、可以解释机器学习算法使用过程中的很多细节问题。能够更加完整地刻画机器学习应用的流程。

2023-06-06 11:15:02

392

每日一课 | 智慧灯杆人工智能之实践方法二：机器学习

3．机器学习谷歌CEO桑达尔·皮查伊在一封致股东信中，把机器学习誉为人工智能和计算的真正未来，可想而知机器学习在人工智能研究领域的重要地位。机器学习的方式包括有监督学习、无监督学习、半监督学习和强化学习

2022-03-22 09:50:11

470

基于机器学习算法的校准优化方案

2023-06-29 12:35:49

236

智能数字辨识水表-基于机器学习算法

智智能数字辨识水表-基于机器学习算法

2023-08-10 11:26:40

371

深度学习算法简介深度学习算法是什么深度学习算法有哪些

深度学习算法简介深度学习算法是什么?深度学习算法有哪些? 作为一种现代化、前沿化的技术，深度学习已经在很多领域得到了广泛的应用，其能够不断地从数据中提取最基本的特征，从而对大量的信息进行机器学习

2023-08-17 16:02:56

6007

机器学习和深度学习的区别

的区别。 1. 机器学习机器学习是指通过数据使机器能够自动地学习和改进性能的算法。机器学习是人工智能的一个重要分支，它通过一系列的训练样本，让机器从数据中学习规律，从而得出预测或决策。机器学习算法可以分为有监督学习

2023-08-17 16:11:40

2734

机器学习算法的5种基本算子

机器学习算法的5种基本算子机器学习是一种重要的人工智能技术，它是为了让计算机能够通过数据自主的学习和提升能力而发明的。机器学习算法是机器学习的核心，它是指让计算机从数据中进行自主学习并且可以实现

2023-08-17 16:11:46

1245

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法汇总机器学习算法分类机器学习算法模型机器学习是人工智能的分支之一，它通过分析和识别数据模式，学习从中提取规律，并用于未来的决策和预测。在机器学习中，算法是最基本的组成部分之一。算法

2023-08-17 16:11:48

632

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器学习算法优缺点? 机器学习算法总结机器学习算法是一种能够从数据中自动学习的算法。它能够从训练数据中学习特征，进而对未知数据进行分类、回归、聚类等任务。通过

2023-08-17 16:11:50

939

机器学习算法入门机器学习算法介绍机器学习算法对比

机器学习算法入门机器学习算法介绍机器学习算法对比机器学习算法入门、介绍和对比随着机器学习的普及，越来越多的人想要了解和学习机器学习算法。在这篇文章中，我们将会简单介绍机器学习算法的基本概念

2023-08-17 16:27:15

569

机器学习vsm算法

机器学习vsm算法随着机器学习技术的不断发展，相似性计算是机器学习中的重要组成部分。在信息检索、文本挖掘、机器翻译等领域中，相似性计算是必不可少的一项技术。在这些领域中，我们通常使用向量空间模型

2023-08-17 16:29:35

529

机器学习是什么意思？机器学习属于什么分支？机器学习有什么用处？

机器学习是什么意思？机器学习属于什么分支？机器学习是什么有什么用处？机器学习是指让计算机通过经验来不断优化和改进自身的算法和模型的过程。因此，机器学习可以被理解为是一种从数据中自动获取规律和知识

2023-08-17 16:30:04

1148

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？机器学习是一种人工智能技术，通过对数据的分析和学习，为计算机提供智能决策。机器学习算法是实现机器学习的基础。常见的机器学习算法

2023-08-17 16:30:11

1245

机器学习的研究现状和发展趋势机器学习的常见算法和优缺点

随着计算能力和大数据的崛起，机器学习算法正迎来快速发展的时期。在研究层面上，机器学习和深度学习是当前最主要的热点。在计算能力的推动下，机器学习算法取得了许多重大突破，如AlphaGo战胜人类棋手

2023-08-22 17:49:27

1659

已全部加载完成

搜索历史