关于机器学习的六种基础算法来源、用途、演变

文章开头，吴恩达回忆他的研究历程中曾有一次抉择：

多年前，在一次项目中，选择算法时，他不得不在神经网络与决策树学习算法之间做选择。考虑到计算预算，他最终选择了神经网络，在很长的一段时间内弃用增强决策树。

这是一个错误的决定，「幸好我的团队很快修改了我的选择，项目才成功。」吴恩达谈道。

他由此感叹，不断学习与更新基础知识是十分重要的。与其他技术领域一样，随着研究人员的增加、研究成果数量的增长，机器学习领域也在不断发展。但有些基础算法与核心思想的贡献是经得起时间考验的：

算法：线性和逻辑回归、决策树等

概念：正则化、优化损失函数、偏差/方差等

在吴恩达看来，这些算法与概念是许多机器学习模型的核心思想，包括房价预测器、文本-图像生成器（如DALL·E）等。

在最新的这篇文章中，吴恩达与团队调研了六种基础算法的来源、用途、演变等，并提供了较为详细的讲解。

这六种算法分别是：线性回归、逻辑回归、梯度下降、神经网络、决策树与k均值聚类算法。

线性回归：直的&窄的

线性回归是机器学习中的一个关键的统计方法，但它并非不战而胜。它由两位杰出的数学家提出，但200 年过去了，这个问题仍未解决。长期存在的争议不仅证明了该算法具有出色的实用性，还证明了它的本质十分简单。那么线性回归到底是谁的算法呢？ 1805 年，法国数学家 Adrien-Marie Legendre 发表了将一条线拟合到一组点的方法，同时试图预测彗星的位置（天体导航是当时全球商业中最有价值的科学方向，就像今天的人工智能一样）。四年后，24 岁的德国神童 Carl Friedrich Gauss （高斯）坚称他自 1795 年以来一直在使用它，但认为它太琐碎了，无法写。高斯的主张促使Legendre匿名发表了一份文章，称“一位非常著名的几何学家毫不犹豫地采用了这种方法。” 斜率和偏差：当结果与影响它的变量之间的关系遵循直线时，线性回归很有用。例如，汽车的油耗与其重量成线性关系。

汽车的油耗 y 与其重量 x 之间的关系取决于直线的斜率 w（油耗随重量上升的幅度）和偏置项 b（零重量时的油耗）：y=w*x+b。

在训练期间，给定汽车的重量，算法会预测预期的油耗。它比较了预期和实际的油耗。然后，它将平方差最小化，通常通过普通最小二乘技术，磨练 w 和 b 的值。

考虑汽车的阻力可以生成更精确的预测。附加变量将线延伸到平面。通过这种方式，线性回归可以容纳任意数量的变量/维度。

普及的两个步骤：该算法立即帮助航海者追踪星星，以及帮助后来的生物学家（尤其是查尔斯·达尔文的堂兄Francis Galton）识别植物和动物的可遗传特征。这两项深入发展释放了线性回归的广泛潜力。1922 年，英国统计学家 Ronald Fisher 和 Karl Pearson 展示了线性回归如何适应相关性和分布的一般统计框架，使其在所有科学中都有用。而且，近一个世纪后，计算机的出现提供了数据和处理能力，可以更大程度地利用它。 应对歧义：当然，数据永远不会被完美地衡量，有些变量比其他变量更重要。这些生活事实激发了更复杂的变体。例如，带有正则化的线性回归（也称为「岭回归」，ridge regression）鼓励线性回归模型不要过多地依赖于任何一个变量，或者更确切地说，均匀地依赖于最重要的变量。如果为了简单起见，另一种形式的正则化（L1 而不是 L2）会产生 lasso（压缩估计），鼓励尽可能多的系数为零。换句话说，它学会选择具有高预测能力的变量并忽略其余的。弹性网络结合了这两种类型的正则化。当数据稀疏或特征看起来相关时，它很有用。在每个神经元中：现在，简单的版本仍然非常有用。神经网络中最常见的神经元类型是线性回归模型，随后是非线性激活函数，使线性回归成为深度学习的基本组成部分。

逻辑回归：跟随曲线

曾经有一段时间，逻辑回归只用于对一件事进行分类：如果你喝了一瓶毒药，你可能会被贴上的标签是“活着”还是“死去”呢？时代变了，今天，不仅呼叫紧急服务为这个问题提供了更好的答案，而且逻辑回归也成为了深度学习的核心。 毒物控制： 逻辑函数可以追溯到 1830 年代，当时比利时统计学家 P.F. Verhulst 发明它来描述人口动态：随着时间的推移，指数增长的初始爆炸随着它消耗可用资源而趋于平缓，从而产生特征逻辑曲线。一个多世纪过去后，美国统计学家 E. B. Wilson 和他的学生 Jane Worcester 又设计了逻辑回归来计算给定有害物质有多少是致命的。 拟合函数：逻辑回归将逻辑函数拟合到数据集，以便预测给定事件（例如，摄入士的宁）发生特定结果（例如，过早死亡）的概率。

训练水平调整曲线的中心位置，垂直调整曲线的中间位置，以最大限度地减少函数输出与数据之间的误差。

将中心调整到右侧或左侧意味着杀死普通人需要或多或少的毒药。陡峭的坡度意味着确定性：在中途点之前，大多数人幸存下来；超过一半，「就只能说再见了」（死亡的意思）。缓坡更宽容：低于曲线中部，一半以上幸存；再往上，只有不到一半的人会幸存。

在一个结果和另一个结果之间设置一个阈值，比如 0.5，曲线就变成了一个分类器。只需在模型中输入剂量，您就会知道您应该计划聚会还是葬礼。

更多结果：Verhulst 的工作发现了二元结果的概率，忽略了进一步的可能性，例如中毒受害者可能会进入来世的哪一边。他的继任者扩展了算法：

在 1960 年代后期，英国统计学家 David Cox 和荷兰统计学家 Henri Theil 独立工作，对具有两种以上可能结果的情况进行了逻辑回归。

进一步的工作产生了有序逻辑回归，其中结果是有序值。

为了处理稀疏或高维数据，逻辑回归可以利用与线性回归相同的正则化技术。

图注：David Cox 多功能曲线：逻辑函数以相当准确的方式描述了广泛的现象，因此逻辑回归在许多情况下提供了有用的基线预测。在医学上，它可以估计死亡率和疾病风险。在政治学中，它预测选举的赢家和输家。在经济学中，它预测商业前景。更重要的是，它在各种各样的神经网络中驱动一部分神经元（其中非线性是 Sigmoid 函数）。

梯度下降：一切都在下坡

想象一下黄昏后在山上徒步旅行，发现脚下什么都看不到。而且您的手机电池没电了，因此您无法使用 GPS 应用程序找到回家的路。您可能会通过梯度下降找到最快的路径。小心不要从悬崖上走。 太阳和地毯： 梯度下降比通过陡峭的地形下降更有利。1847年，法国数学家Augustin-Louis Cauchy发明了近似恒星轨道的算法。60 年后，他的同胞 Jacques Hadamard 独立开发了它来描述薄而灵活的物体（如地毯）的变形，这可能会使膝盖向下徒步更容易。然而，在机器学习中，它最常见的用途是找到学习算法损失函数的最低点。 向下爬：经过训练的神经网络提供了一个函数，该函数在给定输入的情况下计算所需的输出。训练网络的一种方法是通过迭代计算实际输出与期望输出之间的差异，然后更改网络的参数值以缩小差异，从而将输出中的损失或误差最小化。梯度下降缩小了差异，将计算损失的函数最小化。网络的参数值相当于地形上的一个位置，损失的是当前高度。随着你的下降，你可以提高网络计算接近所需输出的能力。可见性是有限的，因为在典型的监督学习情况下，该算法仅依赖于网络的参数值和损失函数的梯度或斜率——即你在山上的位置和你脚下的斜率。

基本方法是向地形下降最陡的方向移动。诀窍是校准你的步幅。步幅太小，就需要很长时间才能取得进展；步幅太大，你就会跳入未知的领域，可能是上坡而不是下坡。

给定当前位置，算法通过计算损失函数的梯度来估计最快下降的方向。梯度指向上坡，那么该算法就是通过减去梯度的一小部分来以相反的方向前进。称为学习率的分数 α 决定了再次测量梯度之前的步长。

反复做这几个步骤，希望你能到达一个山谷。恭喜！

卡在山谷里：太糟糕了，你的手机没电了，因为算法可能没有把你推到凸山的底部。你可能会陷入由多个山谷（局部最小值）、山峰（局部最大值）、鞍点（鞍点）和高原组成的非凸面景观中。事实上，图像识别、文本生成和语音识别等任务都是非凸的，并且已经出现了梯度下降的许多变体来处理这种情况。例如，该算法可能具有帮助它放大小幅上涨和下跌的动量，从而使其更有可能到达底部。研究人员设计了如此多的变体，以至于看起来优化器的数量与局部最小值一样多。幸运的是，局部最小值和全局最小值往往大致相等。 最优优化器：梯度下降是寻找任一函数的最小值的明确选择。在可以直接计算精确解的情况下——例如，具有大量变量的线性回归任务中——它可以逼近一个值，而且通常速度更快、成本更低。但它确实在复杂的非线性任务中发挥了作用。凭借梯度下降和冒险精神，你可能可以及时赶出山区吃晚饭。

神经网络：寻找函数

让我们先把这个问题弄清楚：大脑不是一个图形处理单元集，如果它是的话，那它运行的软件要比典型的人工神经网络复杂得多。而神经网络的灵感来自大脑的结构：一层层相互连接的神经元，每个神经元根据其相邻状态来计算自己的输出，由此产生的一连串活动形成了一个想法——或识别出一张猫的照片。 从生物到人工：大脑通过神经元之间相互作用来学习的想法可以追溯到 1873 年，但直到 1943 年，美国神经科学家 Warren McCulloch 和 Walter Pitts 才利用简单的数学规则建立了生物神经网络模型。1958 年，美国心理学家Frank Rosenblatt开发出感测器——这是一种在打卡机上实现的单层视觉网络，旨在为美国海军建立一个硬件版本。 越大越好：Rosenblatt 的发明只能识别单线分类。之后，乌克兰数学家 Alexey Ivakhnenko 和 Valentin Lapa 通过在任意层数中堆叠神经元网络，克服了这一限制。1985 年，独立工作的法国计算机科学家 Yann LeCun、David Parker 和美国心理学家 David Rumelhart 及其同事，描述了使用反向传播来有效训练此类网络。在新千年的第一个十年中，包括 Kumar Chellapilla、Dave Steinkraus 和 Rajat Raina（与吴恩达合作）在内的研究人员通过使用图形处理单元进一步推动了神经网络的发展，这使得越来越大的神经网络能从互联网生成的海量数据中得到学习。 适合每项任务：神经网络背后的原理很简单：对于任何任务，都有一个可执行它的函数。一个神经网络通过组合多个简单函数构成可训练函数，每个函数由单个神经元执行。一个神经元的功能由称为「权重」的可调参数决定。给定这些权重和输入示例及其所需输出的随机值，就可以反复更改权重，直到可训练的函数能完成手头的任务。

一个神经元可接受各种输入（例如，代表像素或单词的数字，或前一层的输出），将它们与权重相乘，乘积相加，并得出由开发人员选择的非线性函数或激活函数的总和。期间要考虑到它是线性回归、加上一个激活函数。

训练修改权重。对于每个示例输入，网络会计算一个输出并将其与预期输出进行比较。反向传播可通过梯度下降来改变权重，以减少实际输出和预期输出间的差异。当有足够多（好的）例子重复这个过程足够多次，网络就能学会执行这个任务。

黑匣子：虽然运气好的话，一个训练有素的网络可以完成它的任务，但最终你要阅读一个函数，往往会非常复杂——包含数千个变量和嵌套的激活函数——以至于解释网络是如何成功完成其任务也是非常困难的。此外，一个训练有素的网络只和它所学的数据一样好。例如，如果数据集有偏差，那么网络的输出也会出现偏差。如果它只包含猫的高分辨率图片，那它对低分辨率图片的反应就不得而知了。 一个常识： 在报道 Rosenblatt 于1958年发明的感测器时，《纽约时报》开辟了人工智能炒作的道路，报道中提到“美国海军期望拥有一台会走路、说话、看、写、自我复制和意识到自己存在的电子计算机雏形。” 虽然当时的感测器没有达到这个要求，但它产生了许多令人印象深刻的模型：用于图像的卷积神经网络；文本的循环神经网络；以及用于图像、文本、语音、视频、蛋白质结构等的transformers。它们已经做出了令人惊叹的事情，像下围棋时的表现超过了人类水平，在诊断X射线图像等实际任务中也接近人类水平。然而，它们在常识和逻辑推理方面的问题仍然较难应对。

决策树：从根到叶

亚里士多德是一个什么样的「野兽」？这位哲学家的追随者、第三世纪期间生活在叙利亚的 Porphyry 想出了一个合乎逻辑的方法来回答这个问题。他将亚里士多德提出的“存在类别”从一般到具体组合起来，将亚里士多德依次归入到每个分类中：亚里士多德的存在是物质的而不是概念或精神；他的身体是有生命的而不是无生命的；他的思想是理性的而不是非理性的。因此，他的分类是人类。中世纪的逻辑教师将这个序列绘制为垂直流程图：一个早期的决策树。 数字差异：快进到 1963 年，密歇根大学社会学家John Sonquist和经济学家James Morgan在将调查的受访者分组时，首次在计算机中实行了决策树。随着自动训练算法软件的出现，这种工作变得很普遍，如今包括 scikit-learn 等在内的各种机器学习库也已经使用决策树。这套代码是由斯坦福大学和加州大学伯克利分校的四位统计学家花费了10 年时间开发的。到今天，从头开始编写决策树已经成为了《机器学习 101》中的一项家庭作业。 空中的根：决策树可以执行分类或回归。它向下生长，从根部到树冠，将一个决策层次结构的输入示例分类为两个（或更多）。想到德国医学家和人类学家Johann Blumenbach的课题：大约在 1776 年，他首先将猴子与猿（撇开人类除外）区分开来，在此之前，猴子和猿是被归为一类的。这种分类取决于各种标准，例如是否有尾巴、胸部狭窄或宽阔、是直立还是蹲伏、还有智力的高低。使用经训练的决策树来为这类动物贴上标签，逐一考虑每个标准，最终将这两组动物分开。

这棵树从一个可视为包含了所有案例的生物数据库的根节点出发——黑猩猩、大猩猩和红毛猩猩，以及卷尾猴、狒狒和狨猴。根会在两个子节点间提供选择，是否表现出某种特定特征，导致两个子节点包含具有和不具有该特征的示例。以此类推，这个过程中以任意数量的叶节点结束，每个叶节点都包含大部分或全部属于一个类别。

为了成长，树必须找到根决策。要做选择，则得考虑所有的特征及其价值——后附肢、桶状胸等——并选择能够最大限度提高分割纯度的那个特征。「最佳纯度」被定义为一个类别示例会 100% 进入一个特定的子节点、而不进入另一个节点。分叉很少在只做了一个决定之后就百分之百纯粹、且很可能永远也达不到。随着这个过程继续进行，产生一个又一个层次的子节点，直至纯度不会因为考虑更多的特征而增加多少。此时，这棵树树已经完全训练好了。

在推理时，一个新的示例从上到下经历过决策树，完成每个级别不同决策的评估。它会得到它所在叶节点所包含的数据标签。

进入前 10 名：鉴于 Blumenbach 的结论（后来被Charles Darwin推翻），即人类与猿的区别在于宽阔的骨盆、手和紧牙的牙齿，如果我们想扩展决策树以不仅分类猿和猴子，而是对人类进行分类，那会怎么样呢？澳大利亚计算机科学家 John Ross Quinlan 在 1986 年通过 ID3 实现了这一可能，它扩展了决策树，以支持非二元结果。2008 年，在IEEE国际数据挖掘会议策划的数据挖掘十大算法名单中，一项命名为 C4.5 的扩展细化算法名列前茅。在一个创新猖獗的世界里，这就是持久力。 扒开树叶： 决策树确实有一些缺点。它们很容易通过增加多级别层次来过度拟合数据，以至于叶节点只包括一个例子。更糟糕的是，它们很容易出现蝴蝶效应：更换一个例子，长出来的树就大不相同。 走进森林： 美国统计学家 Leo Breiman 和新西兰统计学家 Adele Cutler 将这一特征转化为优势，于 2001 年开发了随机森林（random forest）——这是一个决策树的集合，每个决策树会处理不同的、重叠的示例选择，并对最终结果进行投票。随机森林和它的表亲XGBoost不太容易过度拟合，这有助于使它们成为最受欢迎的机器学习算法之一。这就像让亚里士多德、Porphyry、Blumenbach、Darwin、 Jane Goodall、Dian Fossey和其他 1000 位动物学家一起在房间里，确保你的分类是最好的。

K均值聚类：群体思维

如果你在聚会上与其他人站得很近，那么你们很可能有一些共同点。这就是使用 k 均值聚类将数据点分组的想法。无论是通过人类机构还是其他力量形成的群体，这个算法都会找到它们。从爆炸到拨号音：美国物理学家 Stuart Lloyd 是贝尔实验室标志性创新工厂和发明原子弹的曼哈顿计划的校友，他于 1957 年首次提出 k-means 聚类，以在数字信号中分配信息，但直到 1982 年才发表这个工作：

论文地址：https://cs.nyu.edu/~roweis/csc2515-2006/readings/lloyd57.pdf 与此同时，美国统计学家 Edward Forgy 在 1965 年描述了一种类似的方法，导致了它的替代名称为「Lloyd-Forgy 算法」。 寻找中心：考虑将聚类分成志同道合的工作组。给定房间中参与者的位置和要形成的组数，k-means 聚类可以将参与者分成大小大致相等的组，每个组都聚集在一个中心点或质心周围。

在训练期间，算法最初通过随机选择 k 人来指定 k 个质心。（K 必须手动选择，找到一个最优值有时非常重要。）然后它通过将每个人与最近的质心相关联来增长 k 个集群。

对于每个集群，它计算分配到该组的所有人的平均位置，并将该平均位置指定为新的质心。每个新的质心可能都没有被一个人占据，但那又如何呢？人们倾向于聚集在巧克力和火锅周围。

计算出新的质心后，算法将个体重新分配到离他们最近的质心。然后它计算新的质心，调整集群，等等，直到质心（以及它们周围的组）不再移动。之后，将新成员分配到正确的集群就很容易。让他们在房间里就位并寻找最近的质心。

预先警告：鉴于最初的随机质心分配，你可能最终不会与你希望与之相处的以数据为中心的可爱 AI 专家在同一组中。该算法做得很好，但不能保证找到最佳解决方案。

不同的距离：当然，聚类对象之间的距离不需要很大。两个向量之间的任何度量都可以。例如，k-means 聚类可以根据他们的服装、职业或其他属性来划分他们，而不是根据物理距离对参加派对的人进行分组。在线商店使用它根据客户的喜好或行为来划分客户，天文学家也可以将相同类型的星星分在一组。 数据点的力量：这个想法产生了一些显着的变化：

K-medoids 使用实际数据点作为质心，而不是给定集群中的平均位置。中心点是可以将到集群中所有点的距离最小化的点。这种变化更容易解释，因为质心始终是数据点。

Fuzzy C-Means Clustering 使数据点能够不同程度地参与多个集群。它根据与质心的距离，用集群的度来代替硬簇分配。

n 维狂欢：尽管如此，原始形式的算法仍然广泛有用——特别是因为作为一种无监督算法，它不需要收集昂贵的标记数据。它的使用速度也越来越快。例如，包括 scikit-learn 在内的机器学习库受益于 2002 年添加的 kd-trees，这些 kd-trees 可以非常快速地划分高维数据。

编辑：黄飞

阅读全文

神经网络(98386) 神经网络(98386)
机器学习(130423) 机器学习(130423)
线性回归(4247) 线性回归(4247)

分享一些最常见最实用的机器学习算法

在这篇文章中，分享一些最常用的机器学习算法。

2017-10-14 14:24:00

8793

六种常用串口接口电路图设计

六种常用串口接口电路图设计。如果你是Win95/98/Me操作系统的话那第1和第2两种是最合适的，制作简单。如果是Win2000/XP操作系统的话第3种最合适，当然如果你的电脑只有25针串口可以用

2023-09-22 06:26:03

六种常见的串口接口电路，你都见过吗？

2019-09-09 07:30:00

六种常见的伺服电机故障以及相对应的电机维修方法

论是哪种伺服电机，使用时间久了，都会产生一些小问题，那今天就给大家带来的是六种常见的电机故障表现。当伺服电机出现小问题，不仅要及时检测出来,而且要找到产生这些故障的原因，伺服电机电机维修师才能对症下药，才可以修理好伺服电机。以下是六种常见的伺服电机故障以及相对应的电机维修方法。

2021-02-01 06:29:46

六种逆变电源的控制算法

`本文将对逆变电源的控制算法进行总结，帮助大家进一步掌握相关知识。只有掌握了逆变电源的控制算法，才能真正意义上的掌握逆变电源的原理和运行方式，从而方便设计。逆变电源的算法主要有以下6种。① 数字

2016-09-26 10:20:35

机器学习算法分享

机器学习算法（1）——Logistic Regression

2020-06-09 13:30:03

机器学习算法如何用于制造无人驾驶汽车？

机器学习算法如何用于制造无人驾驶汽车

2021-03-18 06:27:18

机器学习——期望最大算法

机器学习 - 期望最大（EM）算法

2020-05-21 14:31:34

机器学习之 k-近邻算法(k-NN)

机器学习机器学习100天(5) --- k-近邻算法(k-NN)

2020-05-15 15:06:29

机器学习之高级算法课程学习总结

机器学习：高级算法课程学习总结

2020-05-05 17:17:16

机器学习工程师必知的10大算法

`转一篇好资料机器学习算法可以分为三大类：监督学习、无监督学习和强化学习。监督学习可用于一个特定的数据集（训练集）具有某一属性（标签），但是其他数据没有标签或者需要预测标签的情况。无监督学习可用

2017-04-18 18:28:36

机器学习的算法应用

关于机器学习的相关算法。正版资源，免费看的。

2017-08-24 22:14:36

机器学习的未来

机器学习的未来在工业领域采用机器学习机器学习和大数据

2021-01-27 06:02:18

机器学习简介与经典机器学习算法人才培养

上课时间安排：2022年05月27日 — 2022年05月30日No.1 第一天一、机器学习简介与经典机器学习算法介绍什么是机器学习？机器学习框架与基本组成机器学习的训练步骤机器学习问题的分类

2022-04-28 18:56:07

机器算法学习比较

发生overfitting。关于随机森林和GBDT等组合算法，参考这篇文章：机器学习-组合算法总结缺点：对outlier比较敏感6、SVM支持向量机高准确率，为避免过拟合提供了很好的理论保证，而且就算数据在

2016-09-27 10:48:01

PID算法学习笔记分享

最近在学习与无人机有关的一些控制算法，在这里做一些笔记，今天学的是有关于PID的算法。什么是PID首先关于PID的定义，因为我本身不是自动控制专业出身所以对于概念这个东西比较模糊，可以去社区里面搜

2022-01-14 06:50:34

Python机器学习常用库

分布和模型收敛的诊断工具，也包含一些层次模型。四、GensimGensim被称为“人们的主题建模工具”，其焦点是狄利克雷划分及变体，其支持自然语言处理，能将NLP和其他机器学习算法更容易组合在一起，还

2018-03-26 16:29:41

linux下查看网卡流量的六种方法

本文介绍了linux下查看网卡流量的六种方法，linux系统中使用nload、iftop、iostat等工具查看网卡流量，需要的朋友参考下。

2019-07-25 06:29:53

stm32红外六足机器人

完善这个作品。主要运用的算法1、D-H参数模型2、三轴姿态解算3、六次项足迹规划4、步态规划5、平台姿态解算即18轴加平面轴解算（未完成）知识点1、运动学2、机器人学3、数学基础知识（矩阵、三角函数、坐标系

2014-03-27 18:51:05

【Embedded Pi申请】六足机器人的创新研发

申请理由：关于六足机器人，基本上是用18个舵机一起使用来驱动六足完成相应的动作组，而一般的89C52以及STC12系列的单片机只能让六足机器人做简单的动作，无法完成相应的创新。所以能有一块STM32

2015-11-25 15:35:26

【下载】《机器学习》+《机器学习实战》

、谋发展的决定性手段，这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。本书第一部分主要介绍机器学习基础，以及如何利用算法进行分类，并逐步介绍了多种经典的监督学习算法，如k近邻算法

2017-06-01 15:49:24

【专辑精选】机器学习之算法教程与资料

电子发烧友总结了以“算法”为主题的精选干货，今后每天一个主题为一期，希望对各位有所帮助！（点击标题即可进入页面下载相关资料）经典算法大全（51个C语言算法+单片机常用算法+机器学十大算法）11种常见

2019-05-09 17:06:40

【转帖】六种常用算法

：“算法就是能够证明正确的解题步骤，算法有许多种，最简单的无非下面的六种：递推法、贪心法、列举法、递归法、分治法和模拟法。刚听名字挺吓人的，其实有好多程序我们平常都见过。这些算法当中，最最简单的莫过于递推算法

2017-07-28 17:20:29

【阿里云大学免费精品课】机器学习入门：概念原理及常用算法

摘要：阿里云大学联合蚂蚁金服高级算法专家推出了免费的机器学习入门课程：机器学习入门：概念原理及常用算法（点击开始学习） AlaphaGo与围棋界的较量，吸引了全世界的目光，也让大家见识到了机器

2017-06-23 13:51:15

人工智能和机器学习的前世今生

学习算法评估一个用一种特殊的数据来泛化的预测模型。因此，必须有大量的实例，以供机器学习算法用来理解系统的行为。现在，当机器学习算法与新类型的数据一起出现时，系统将能够生成类似的预测。了解机器学习算法

2018-08-27 10:16:55

人工智能基本概念机器学习算法

目录人工智能基本概念机器学习算法1. 决策树2. KNN3. KMEANS4. SVM5. 线性回归深度学习算法1. BP2. GANs3. CNN4. LSTM应用人工智能基本概念数据集：训练集

2021-09-06 08:21:17

什么是机器学习? 机器学习基础入门

是将提供的两个数字相乘。图2。有了机器学习，我们就有了数据(输入)和答案(输出) ，并且需要计算机通过确定输入和输出如何以对整个数据集为真的方式相互关联来推导出一种排序算法假设我使用一个简单的示例来定义

2022-06-21 11:06:37

使用 Python 开始机器学习

StackOverFlow上找到关于很多问题详细解答（学习基石）。再次，一个强大的社区带来的副产品就是大量有用程序库（Python内部自带的和第三方软件），基本上可以解决你所有的问题（包括机器学习）。但我

2018-12-11 18:37:19

保持电容性负载稳定的六种方法

本帖最后由 gk320830 于 2015-3-8 23:36 编辑保持电容性负载稳定的六种方法本系列的第10部分是我们所熟悉的《电气工程》杂志(Electrical Engineering

2009-09-25 09:31:04

内存六种异常故障排除法

内存六种异常故障排除法　　当启动电脑、运行操作系统或应用软件的时候、常常会因为内存出现异常而导致操作失败。笔者使用电脑多年，总结了一些内存出现异常的原因，并给出以下几种处理方法，希望可以给大家一些

2011-02-27 16:57:37

分析六种电流测量方法优缺点对比

在极端条件下六种电流测量方法的优缺点对比

2021-05-07 06:29:01

基于labview的六种模式的跑马灯程序

基于labview的六种模式的跑马灯

2013-12-31 12:01:51

如何在STM板上使用机器学习算法对通过工业传感器获取的气体传感器数据进行分类？

我想在 STM 板上使用机器学习算法对通过工业传感器获取的气体传感器数据进行分类。知道哪种 STM32 变体最适合此应用吗？

2023-01-10 07:10:16

干货 | 这些机器学习算法，你了解几个？

！”相反，你心里通常有一个最终目标，如利用它来预测结果或分类观察。所以在机器学习中，有一种叫做“没有免费的午餐”的定理。简而言之，它的意思就是说没有任何一种算法可以完美地解决每个问题，这对于监督式学习

2019-09-22 08:30:00

怎么实现六足机器人的设计？

2021-11-22 08:02:22

怎样去设计一种基于六旋翼无人机的智能空中作业机器人呢

怎样去设计一种基于六旋翼无人机的智能空中作业机器人呢？基于六旋翼无人机的智能空中作业机器人有哪些功能？

2021-11-11 06:47:14

最值得学习的机器学习编程语言

选择最能满足个人需求，以及保证自己将来能够在 AI 和机器学习领域顺利发展的编程语言。在本文中，我们将介绍最值得学习的 5 种编程语言，这些语言不仅能够为机器学习征服世界铺平道路，而且也能够帮助你处理好日常工作。下面，我们来看看为了在 AI 和机器学习领域站稳脚跟，你需要学习的五种语言。

2021-03-02 06:22:38

有没有搞机器学习算法研究的啊？

有没有搞机器学习、人工智能相关的算法研究的啊？自己一个人搞感觉挺难的，希望找到志同道合的朋友，相互探讨。

2016-02-26 09:56:00

电子电气产品中限用的六种物质（铅、镉、汞、六价铬、多溴联苯、多溴二苯醚）浓度的

`<p><font face="Verdana">电子电气产品中限用的六种物质（铅、镉、汞、六价铬、多溴

2009-10-13 08:13:35

盘点工业机器人常见的六种传感器类型

，传感器为机器人增加了感觉，也为机器人高精度智能化的工作提供了基础。下面，就跟着小编来看看当今工业机器人领域最常用的六种传感器吧。1．二维视觉传感器二维视觉传感器主要就是一个摄像头，它可以完成物体运动

2018-11-08 15:52:28

经典算法大全（51个C语言算法+单片机常用算法+机器学十大算法）

learning），又称再励学习、评价学习，学习不是单一方法，而是一种机器学习方式，在智能控制机器人及分析预测等领域有许多应用。强化学习例子：马尔可夫决策过程通用机器学习算法列表 1. 线性回归

2018-10-23 14:31:12

请问一下如何去打造一种机器学习流水线？

如何去打造一种机器学习流水线？有哪些步骤？

2021-07-14 06:26:29

请问一下怎样去设计一种基于PID算法的巡线机器人？

怎样去设计一种基于PID算法的巡线机器人？基于PID算法的巡线机器人有哪些优势？

2021-07-27 06:54:05

高级机器学习算法工程师--【北京】

职位描述：1. 负责计算机视觉&机器学习（包括深度学习）算法的开发与性能提升，负责下述研究课题中的一项或多项，包括但不限于：人脸识别、检测、活体、跟踪、分类、语义分割、深度估计、图像处理

2017-12-07 14:34:41

一文详解机器学习工程师必知的10大算法

Netflix的算法可以根据你以前看过的电影来进行电影推荐，而Amazon的算法则可以根据你以前买过的书来推荐书籍。所以如果你想了解更多有关机器学习的内容，那么你该如何入门？

2018-07-08 11:05:00

1536

一文解析机器学习常用35大算法

本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然，本文收录的算法并不完全，分类的方式也不唯一。

2018-06-30 04:24:00

3645

机器学习经典算法-最优化方法

机器学习算法之最优化方法

2017-09-04 10:05:10

机器学习含义的图文解说

颜色，大小，形状，产地，卖家，等等。（这些称之为特征）。还记录下这个芒果甜不甜，是否多汁，是否成熟（输出变量）。你将这些数据提供给一个机器学习算法（分类算法/回归算法），然后它就会学习出一个关于芒果的物理属性

2017-09-20 10:24:44

Spark机器学习库的各种机器学习算法

本文将简要介绍Spark机器学习库（Spark MLlibs APIs）的各种机器学习算法，主要包括：统计算法、分类算法、聚类算法和协同过滤算法，以及各种算法的应用。你不是一个数据科学家。根据

2017-09-28 16:44:43

六种常见机器学习普遍错误

机器学习很大程度上就像软件工程一样，比如我现在要实现一个key-value的数据库，那么有很多种模式都可以实现，但是他们最终所达到的效果却是千差万别的。同样，在机器学习领域，如果我想实现一个分类

2017-11-15 19:20:28

554

机器学习算法分类

机器学习起源于人工智能，可以赋予计算机以传统编程所无法实现的能力，比如飞行器的自动驾驶、人脸识别、计算机视觉和数据挖掘等。机器学习的算法很多。很多时候困惑人们的是，很多算法是一类算法，而有些算法又是

2018-01-05 17:36:10

3101

人工智能之机器学习常见算法

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里小编为您总结一下常见的机器学习算法，以供您在工作和学习中参考。

2018-02-02 17:20:46

1552

机器学习新手最适合学习的10个算法

算法永远是一段代码的灵魂，面对海量的机器学习算法，萌新最爱问的是，“我该选什么算法？”

2018-03-29 14:10:39

7887

关于机器学习PCA算法的主成分分析

人工智能机器学习有关算法内容，人工智能之机器学习主要有三大类：1）分类；2）回归；3）聚类。今天我们重点探讨一下PCA算法。 PCA（主成分分析）是十大经典机器学习算法之一。PCA是Pearson在1901年提出的，后来由Hotelling在1933年加以发展提出的一种多变量的统计方法。

2018-06-27 17:23:00

2985

两个关于机器学习的故事

如果你是搞机器学习算法的，那你应该聚焦在如何做出让人们喜欢用的通用工具（就像厨房用具，如果你喜欢这样类比的话）。这项业务被称为机器学习研究，通常由学术界或科技巨头的研究院来完成。

2018-07-03 11:39:32

2550

经典的机器学习算法汇总

本文将用一句话来总结每种典型的机器学习算法，帮你抓住问题的本质，强化理解和记忆。

2018-08-11 10:24:15

5500

机器学习逐渐在EDA领域扮演要角开启了芯片设计的新应用途径

资料近用即为一大课题，而安谋（ARM）自2年前开始在芯片设计上进行关于程序设计错误的大量分析，发现机器学习技术有助于实现无程序错误的芯片开发，这似乎也开启了运用机器学习技术协助芯片设计的新应用途径。

2018-09-02 11:00:00

1187

关于机器学习的三大类型分析

为了把机器学习技术应用于工业，须先了解机器学习分成哪里些种类，有哪里些不同的算法，以及实际应用时有什么值得注意的地方。

2018-10-20 08:04:00

4539

机器学习算法常用指标汇总

机器学习性能评价标准是模型优化的前提，在设计机器学习算法过程中，不同的问题需要用到不同的评价标准，本文对机器学习算法常用指标进行了总结。

2019-02-13 15:09:19

3945

机器学习十大算法精髓总结

最常见的机器学习算法是学习映射Y = f(X)来预测新X的Y，这叫做预测建模或预测分析。

2019-05-05 09:21:00

3474

详解机器学习分类算法KNN

本文主要介绍一个被广泛使用的机器学习分类算法，K-nearest neighbors（KNN），中文叫K近邻算法。

2019-10-31 17:18:14

5657

十大机器学习算法中的线性判别分析的详细介绍

先前呢，我们在最受欢迎的十大机器学习算法-part1和最受欢迎的十大机器学习算法-part2两篇文章中简单介绍了十种机器学习算法，有的读者反映看完还是云里雾里，所以，我会挑几种难理解的算法详细讲解一下，今天我们介绍的是线性判别分析。

2020-02-03 07:28:18

6973

各类机器学习分类算法的优点与缺点分析

机器学习中有许多分类算法。本文将介绍分类中使用的各种机器学习算法的优缺点，还将列出他们的应用范围。

2020-03-02 09:50:12

3298

人人都能懂的机器学习算法原理教程免费下载

算法公式挺费神，机器学习太伤人。任何一个刚入门机器学习的人都会被复杂的公式和晦涩难懂的术语吓到。但其实，如果有通俗易懂的图解，理解机器学习的原理就会非常容易。本文整理了一篇博客文章的内容，读者可根据这些图理解看似高深的机器学习算法。

2020-05-21 08:00:00

理解机器学习中的算法与模型

对于初学者来说，这很容易让人混淆，因为“机器学习算法”经常与“机器学习模型”交替使用。这两个到底是一样的东西呢，还是不一样的东西？作为开发人员，你对排序算法、搜索算法等“算法”的直觉，将有助于你厘清这个困惑。在本文中，我将阐述机器学习“算法”和“模型”之间的区别。

2020-07-31 15:38:08

3347

机器学习算法使用机器来了解给定的数据集

机器学习一词经常与AI互换使用，尽管有明显的区别。机器学习算法使用机器来了解给定的数据集。机器学习的一个子集包括深度学习，它在网络安全领域显示出了巨大的希望

2020-09-16 17:05:24

1980

机器学习的范围和算法

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2020-11-12 10:19:12

1203

机器学习的范围/算法/分类

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2021-01-21 09:29:06

3315

六种关于双电源及稳态常见电路图

2021-03-10 09:27:15

最实用的的五种机器学习算法

最实用的机器学习算法Top5 demi 在周一, 04/01/2019 - 10:35 提交本文将推荐五种机器学习算法，你应该考虑是否将它们投入应用。这五种算法覆盖最常用于聚类、分类、数值预测

2021-03-24 16:14:31

5987

详谈机器学习模型算法的质量保障方案

近年来，机器学习模型算法在越来越多的工业实践中落地。在滴滴，大量线上策略由常规算法迁移到机器学习模型算法。如何搭建机器学习模型算法的质量保障体系成为质量团队急需解决的问题之一。本文整体介绍了机器学习模型算法的质量保障方案，并进一步给出了滴滴质量团队在机器学习模型效果评测方面的部分探索实践。

2021-05-05 17:08:00

2010

机器学习可靠性与算法优化

机器学习可靠性与算法优化教材免费下载。

2021-05-19 09:39:29

基于机器学习的哈希检索算法综述

2021-06-10 11:05:56

关于机器学习的十大经典算法

C4.5算法是机器学习算法中的一种分类决策树算法，其核心算法是ID3算法.C4.5算法继承了ID3算法的优点，并在以下几方面对ID3算法进行了改进。

2021-06-23 09:45:25

机器学习和深度学习算法流程

但是无可否认的是深度学习实在太好用啦！极大地简化了传统机器学习的整体算法分析和学习流程，更重要的是在一些通用的领域任务刷新了传统机器学习算法达不到的精度和准确率。

2022-04-26 15:07:20

4084

17个机器学习的常用算法

根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法，这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。

2022-08-11 11:20:17

1399

17个机器学习的常用算法！

源自：AI知识干货根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错

2022-08-22 09:57:33

1446

机器学习算法的基础介绍

现在，机器学习有很多算法。如此多的算法，可能对于初学者来说，是相当不堪重负的。今天，我们将简要介绍 10 种最流行的机器学习算法，这样你就可以适应这个激动人心的机器学习世界了！

2022-10-24 10:08:42

1518

常用机器学习算法的基本概念和特点

没有哪一种算法能够适用所有情况，只有针对某一种问题更有用的算法。机器学习算法不会要求一个问题被 100%求解，取而代之的是把问题转化为最优化的问题，用不同的算法优化问题，从而比较得到尽量好的结果

2023-01-17 15:43:09

2979

机器学习算法的随机数据生成简析

在学习机器学习算法的过程中，我们经常需要数据来验证算法，调试参数。

2023-03-15 09:07:48

360

如何评估机器学习模型的性能？机器学习的算法选择

如何评估机器学习模型的性能？典型的回答可能是：首先，将训练数据馈送给学习算法以学习一个模型。第二，预测测试集的标签。第三，计算模型对测试集的预测准确率。

2023-04-04 14:15:19

549

机器学习的经典算法与应用

一、机器学习基础概念关于数据机器学习就是喂入算法和数据，让算法从数据中寻找一种相应的关系。 Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据

2023-05-28 11:29:41

652

机器学习理论：k近邻算法

KNN(k-Nearest Neighbors)思想简单，应用的数学知识几乎为0，所以作为机器学习的入门非常实用、可以解释机器学习算法使用过程中的很多细节问题。能够更加完整地刻画机器学习应用的流程。

2023-06-06 11:15:02

392

机器学习中使用的5种常见数据结构和算法

使用数据结构和算法，您的代码可以提高机器学习系统的速度、可伸缩性和可解释性。选择的最佳设计将取决于主要问题的精确要求。每种设计都有一定的优势和用途。

2023-06-14 09:35:20

1241

高效理解机器学习

来源：DeepNoMind对于初学者来说，机器学习相当复杂，可能很容易迷失在细节的海洋里。本文通过将机器学习算法分为三个类别，梳理出一条相对清晰的路线，帮助初学者理解机器学习算法的基本原理，从而更高

2023-05-08 10:24:39

322

基于机器学习算法的校准优化方案

2023-06-29 12:35:49

236

智能数字辨识水表-基于机器学习算法

智智能数字辨识水表-基于机器学习算法

2023-08-10 11:26:40

371

机器学习算法的5种基本算子

机器学习算法的5种基本算子机器学习是一种重要的人工智能技术，它是为了让计算机能够通过数据自主的学习和提升能力而发明的。机器学习算法是机器学习的核心，它是指让计算机从数据中进行自主学习并且可以实现

2023-08-17 16:11:46

1245

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法汇总机器学习算法分类机器学习算法模型机器学习是人工智能的分支之一，它通过分析和识别数据模式，学习从中提取规律，并用于未来的决策和预测。在机器学习中，算法是最基本的组成部分之一。算法

2023-08-17 16:11:48

632

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器学习算法优缺点? 机器学习算法总结机器学习算法是一种能够从数据中自动学习的算法。它能够从训练数据中学习特征，进而对未知数据进行分类、回归、聚类等任务。通过

2023-08-17 16:11:50

939

机器学习算法入门机器学习算法介绍机器学习算法对比

机器学习算法入门机器学习算法介绍机器学习算法对比机器学习算法入门、介绍和对比随着机器学习的普及，越来越多的人想要了解和学习机器学习算法。在这篇文章中，我们将会简单介绍机器学习算法的基本概念

2023-08-17 16:27:15

569

机器学习vsm算法

机器学习vsm算法随着机器学习技术的不断发展，相似性计算是机器学习中的重要组成部分。在信息检索、文本挖掘、机器翻译等领域中，相似性计算是必不可少的一项技术。在这些领域中，我们通常使用向量空间模型

2023-08-17 16:29:35

529

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？机器学习是一种人工智能技术，通过对数据的分析和学习，为计算机提供智能决策。机器学习算法是实现机器学习的基础。常见的机器学习算法

2023-08-17 16:30:11

1245

机器学习的研究现状和发展趋势机器学习的常见算法和优缺点

随着计算能力和大数据的崛起，机器学习算法正迎来快速发展的时期。在研究层面上，机器学习和深度学习是当前最主要的热点。在计算能力的推动下，机器学习算法取得了许多重大突破，如AlphaGo战胜人类棋手

2023-08-22 17:49:27

1659

已全部加载完成

搜索历史

关于机器学习的六种基础算法来源、用途、演变

评论