机器学习需要具备哪一些数学基础

今天我们分享的内容，主要是关于机器学习中的基础数学。

一、机器学习会用到哪些数学基础

第一部分，我们先来看一看机器学习需要哪些数学的基础。我们可以先引用一个专家的定义。这个专家是来自美国华盛顿大学的佩罗·多明戈斯。这也是人工智能领域的一个老兵。他对于机器学习给出了这样一个定义，机器学习是由三个部分组成，分别是表示、评价，还有优化。这样的三个步骤，实际上也就对应着在机器学习当中所需要的数学。

（1）机器学习三部曲

表示

在表示这一步当中，我们需要建立起数据，还有实际问题的抽象模型。所以，这里面就包括了两个方面，一方面我们要对要解决的这个实际的问题进行抽象化处理。比方说我们要设计一个算法，判断一个邮件它到底是不是一封垃圾邮件，那么得到的结果无外乎两种，要么是，要么不是。这样一个问题如果对它做抽象，实际上就是个二分分类问题。是，我们可以把它定义成 0，不是，可以把它定义成 1。所以，这个问题最终要解决的是什么呢？输出一个 0 或者 1 的结果。当然把 0 和 1 的意义调过来也可以，用 1 代表是垃圾邮件，0 代表不是，也是可以的。所以，在表示的过程当中，我们要解决的问题就是把我们面临的真实世界当中的一些物理问题给它抽象化，抽象成一个数学问题。抽象出来这个数学问题之后，我们要进一步去解决它，还要对这个数据进行表示。

对于问题抽象完了以后，我们还要对数据进行抽象。在判定这个邮件到底是不是垃圾邮件的时候，我们要怎么判断呢？要根据它的特征进行判断，看一看这个邮件里的关健字是否有关于推销的，或者关于产品的一些关键字。这些特征，这些关键字，我们就要把它表示成一个特征，表示成一个向量，或者表示成其他的形式。表示成向量也好，表示成其他形式也好，都是对这个数据做出了抽象。

在表示阶段，我们需要建立的是数据，还有问题的抽象模型。把这个模型建立出来，然后去寻找合理的算法。

K- 近邻算法。在机器学习当中，我们常见的有 K- 近邻算法。K- 近邻算法在我们的专栏中没有提到，因为它太简单了。它实际上就是，找到一个样本点和这个样本点最近的几个邻居，最近的这 K 个邻居。按照少数服从多数的原则，对它进行分类，这就是 K- 近邻算法。

回归模型。除此之外，还有线性回归，这样的统计学习方法。我建立一个线性回归模型，当然，对二分类我们可以建立逻辑回归模型。

决策树。还有像决策树这样的方法。决策树它不依赖于数据，它完全是自顶向下的一个设计。线性回归也好，逻辑回归也好，它是从数据反过来去推导模型，而决策树直接去用模型判定数据，两个方向不太一样。

SVM 支持向量机。最后，还有 SVM 支持向量机这样的纯数学方法。所以说表示的部分，我们需要把问题和数据进行抽象，这个时候我们就要用到抽象的工具。

评价

给定模型之后，我们如何评价这个模型的好坏？这个时候就需要设定一个目标函数，来评价这个模型的性质。

1.设定目标函数

目标函数的选取也可以有多种形式。像对于我们说到的垃圾邮件这种问题，我们可以定义一个错误率。比方说一个邮件它原本不是垃圾邮件，但是我这个算法误判成了垃圾邮件，这就是一个错例。所以呢，错误率在分类问题当中是个常用的指标，或者说常用的目标函数。

2.最小均方误差和最大后验概率

那么在回归当中呢，我们会使用最小均方误差这样一个常用目标函数，尤其是在线性回归里。除此之外呢，还有最大后验概率，一些其他的指标。

优化

有了目标函数以后，我们要求解这个目标函数在模型之下的一个最优解，这个模型能够获取到的最小错误率，或者最小均方误差是多少呢？我们要求出一个特定的值。没有这个值的话，你如何评价不同的模型它到底是好是坏呢？所以说优化这个步骤它的作用是求解目标函数在模型之下的一个最优解，看看这个模型在解决这个问题的时候，最好能达到什么样的程度。

总结来说，多明戈斯教授总结到的机器学习的三个步骤，包括了表示、评价、优化这样三个步骤，在这三个步骤当中我们会用到不同的数学公式来分别解决这三个问题。

（2）三种数学工具

线性代数

在这三个步骤中，应用了三种不同的工具。在表示这个步骤当中，我们主要使用的工具是什么呢？就是线性代数。线性代数呢，我们在这个专栏里面也提到，它起到的一个最主要的作用就是把具体的事物转化成抽象的数学模型。不管你的世界当中有多么纷繁复杂，我们都可以把它转化成一个向量，或者一个矩阵的形式。这就是线性代数最主要的作用。

所以，在线性代数解决表示这个问题的过程中，我们主要包括这样两个部分，一方面是线性空间理论，也就是我们说的向量、矩阵、变换这样一些问题。第二个是矩阵分析。给定一个矩阵，我们可以对它做所谓的 SVD（singular value decomposition）分解，也就是做奇异值分解，或者是做其他的一些分析。这样两个部分共同构成了我们机器学习当中所需要的线性代数，当然了，这两者也是各有侧重。线性空间的话，我们主要应用在一些解决理论问题当中，矩阵分析在理论当中有使用，在实践当中也有一些使用。

概率统计

我们说到，线性代数起作用是在表示的过程当中。在评价过程中，我们需要使用到概率统计。概率统计包括了两个方面，一方面是数理统计，另外一方面是概率论。

数理统计好理解，我们机器学习当中应用的很多模型都是来源于数理统计。比方说最简单的线性回归，还有逻辑回归，它实际上都是来源于统计学。在具体地给定了目标函数之后，我们在实际地去评价这个目标函数的时候，我们会用到一些概率论。比方说给定了一个分布，我要求解这个目标函数的期望值。在平均意义上，这个目标函数能达到什么程度呢？这个时候就需要使用到概率论。所以说在评价这个过程中，我们会主要应用到概率统计的一些知识。

实际上对于数理统计来说，我们在评价模型的时候，不只关注的是一个目标函数，我们可能还关注一些它的统计特性。比如说它的置信度，或者是其他的一些指标。你这个模型建立起来，它的可信性程度到底有多大，这些在早期的机器学习算法当中也是需要考虑的。当然随着神经网络，随着深度学习的兴起，这部分内容实际上渐渐地衰落，或者渐渐地被忽略。你在神经网络当中可能只需要达到一个这个好的目标函数，好的指标就行，至于说它的置信度，这些我们不去考虑。

所以说，这也是深度学习不太受学数学，或者说学统计学的人待见的一个原因。因为统计学强调什么呢？强调可解释性，你这个模型能够达到什么样的指标，我们能把它清清楚楚地讲明白，为什么能够达到这样的指标，它的原理在哪？它背后的根据在哪？我给定一个分布，假如说高斯分布，那么再给定一个模型，我就可以通过严谨而简洁的这个数学推导，把这个结果以公式的形式给它呈现出来，这个看起来就很高大上，或者说很清楚。但神经网络和深度学习，现在还达不到这样可解释的程度。所以说现在也有人批评，说深度学习是炼金术，主要的原因在这里。我只能够通过调参数调出一个比较好的结果，但是到底这个结果为什么会出现？哪些因素会影响到它？可能还不是那么清晰。所以呢，关于概率统计，我们主要应用在评价这个过程中。

最优化理论

关于优化，就不用说了，我们肯定用到的是最优化理论。在最优化理论当中，主要的研究方向是凸优化。

凸优化当然它有些限制，但它的好处是什么呢？能够简化这个问题的解。因为在优化当中我们都知道，我们要求的是一个最大值，或者是最小值，但实际当中我们可能会遇到一些局部的极大值，局部的极小值，还有鞍点这样的点。凸优化可以避免这个问题。在凸优化当中，极大值就是最大值，极小值也就是最小值。

但在实际当中，尤其是引入了神经网络还有深度学习之后，凸优化的应用范围越来越窄，很多情况下它不再适用，所以这里面我们主要用到的是无约束优化。我在整个范围之内，我对参数，对输入并没有限定。在整个的输入范围内去求解，不设置额外的约束条件。同时，在神经网络当中应用最广的一个算法，一个优化方法，就是反向传播。

（3）三种数学工具和三个步骤并非一一对应

我们今天谈论这个机器学习当中，用到的基础数学都包括哪些呢？包括这三种，线性代数，概率统计，还有最优化理论。这是我们在机器学习当中用到的最基础的一些数学工具。如果大概做一个分类，分别对应到我们机器学习当中，表示、评价，还有优化这样三个步骤。

当然，这种应用它也并不是说一一对应的关系。在表示当中我只用到线性代数，概率统计一点儿都不涉及，同样地，我在评价的时候，线性代数也不涉及，不是这样，都会有一个交叉的过程，但是在每个步骤当中应用到的主要工具还是有所区别。

（4）高等数学是数学工具的基础

当然，在数学工具当中，我们并没有涉及到高等数学，高等数学我们就把它当作一个基础，一个基础中的基础。不光是人工智能，或者说机器学习，只要有数学参与的地方，我们都需要有高等数学的这个基础。那么具体到机器学习当中，我们在高等数学这一块儿用到的比较多的，可能包括求导，微分，这样的一些内容。当然还有这个积分，我们在求解这个目标函数的期望值的时候可能也会遇到。

所以到这呢，我们就说，我们介绍了机器学习当中用到了哪些数学。主要就是这三块，线性代数，概率统计，还有最优化，那么任何复杂的算法实际上都是由这三者的结合叠加所构造出来的，那么这三者在机器学习当中他们起到的作用分别是什么呢？我们可以具体地来看一看。

二、三种数学工具在机器学习中的作用

（1）线性代数

1.将具体事物抽象为数学对象

对于线性代数来说，我们可以对它做一个简单的定义。所谓线性代数是什么？就是数量和结构的一个组合，也就是说，线性代数等于数量加上结构。本身数量呢，它是一个单独的数。对于单个的数我们没有结构可言，对于单个的对象没有结构可言。但是当我们把一组数，或者一堆数排列到一块儿的时候，这个排列不是随机的排列，而是有一定的顺序进行排列的时候，这个时候，数目之间的顺序或者数量之间的顺序就形成了一种结构，这个结构就可以蕴含一定的信息，能够供我们去使用。

除了顺序之外，结构还有另外一层含义。我可以对数量定义一些运算。在线性空间里面我们提到，基本的运算包括什么呢？包括加法，包括数乘，这样一些运算。有了运算之后，我们就可以对不同的对象，单个的数目放在一块儿，按照一定的顺序排列在一起，我们可以把它组成一个向量，组成这样一个对象。那么有了加法，数乘这样一些运算之后，你就可以对这个对象再来进行一些操作。这样的话，就实现了把具体事物给它抽象成数学对象，这样的一个过程。这就是线性代数最主要的一个作用。当然不光是在机器学习里面，在其他应用到线性代数的场合也是一样：把具体的事物抽象成为数学对象。

2.提升大规模运算的效率

当然除此之外呢，它还有另外一个优势，线性代数还有另外一个作用，就是能够提升大规模运算的效率。因为在现代的机器学习当中，我们要处理的数据都是海量的数据，数据的数量是呈指数形式的增长。我们要处理的数据越来越多，如果只是简单地说，用最传统的方法，用一个一个的 for 循环去处理高维的矩阵，它的效率肯定是相当低下。有了线性代数之后，我们可以把矩阵的运算引入到机器学习的算法当中，通过一些额外的库，或者一些额外的软件包，提升大规模运算的效率。这里面最直观的一个例子就是 MATLAB 软件。MATLAB 软件本身名字叫矩阵实验室。它的特点，或者说它的卖点就在于，对矩阵，或者说对向量它操作的高效率。

所以说呢，线性代数，我们把它总结一下，它就等于数量和结构的组合。它的作用，一方面可以把具体的事物抽象成数学对象，另外一方面，可以提升大规模运算的效率。

（2）概率统计

1.利用数据学习模型

如果我们说，线性代数可以看成是数量还有结构的组合的话，那么概率统计就可以看成是模型还有数据的组合。

那么模型和数据组合在一块，实际上是双向的处理。我们机器学习有学习的阶段，我们要利用这个数据去训练这个模型，这个阶段，我们是用数据去学习这个模型。在模型里面，我们就可以去选择。有那么多的模型，像我们刚才说到的，有 K- 近邻的模型，有回归模型，有决策树，还有支持向量机，这样不同的模型。我训练的任务就是用数据来学习这些模型，来确定这个模型的参数，最终得到一个确定的模型。这就可以看成什么呢？看成是在给定数据的情况下，我来求解这个参数，它的条件概率。给定的数据，如果有一部分参数的条件概率是最大的，那么就选择这部分参数，作为我这个模型的参数。实际上，训练过程解决的就是这样一个问题。

当然具体来说，包括生成模型，包括判别模型，那么生成模型我们求解的是输入输出的一个联合概率分布，那么判别模型是一个条件概率分布。但不管怎么样，很多情况下，我们关注的目标都是分布，那么利用数据进行训练的过程也就是学习这个分布的过程。

2.利用模型推断数据

接下来呢，在训练结束之后，我们要这个模型要来干什么呢？要进行预测，也就是说，利用这个模型来进行数据的推断。给定这个模型，我给到一个输入，我输入可能是一个特征，一些特征的组合，形成一个向量。我把这个输入的向量代入到模型当中，就可以求出一个结果，当然也可能是多个结果。我取这个概率最大的结果作为一个输出，这个过程就是反过来利用模型去推断数据的一个过程。所以我们说，概率统计等于模型和数据的一个组合，这个组合是双向的。在学习阶段，我们利用数据来训练模型，在预测阶段，我们利用模型反过来去推断这个数据。

所以，在概率统计这一块，我们关注的是模型的使用，还有概率的求解。当然两者不是完全区别开的，是相互融合的。在建立模型的时候，我们会利用到一些先验概率分布。在求解目标函数的时候，我们也会涉及求解数学期望这样一些操作。这里面我们也给出了一个实例，就是回归分析还有机器学习方法的比较。

（3）最优化理论

概率统计呢，我们可以把它解释成这个模型和数据的一个组合，那么最优化的话，就可以看成是目标和约束的一个组合。在这里面，我们最优化的目标是什么呢？是求解，让这个期望函数，或者让目标函数取到最值的解，手段是什么呢？就是通过调整模型的参数来实现，为什么要调整这个模型的参数？因为很多时候，我们想求解到这个解析解是求不出来的。在很多复杂的问题当中呢，这个解析解是没有办法求出来的。对于线性回归来说，我们可以求解出 Beta 的一个表达式，那样一个矩阵相乘，求逆，再进行相乘的一个表达式。很多时候，这个解析解我们求不到，求不到怎么办？就只能一点一点去试，一步一步去找，我要的最小值或者最大值，它到底在哪？这个时候就会用到我们最优化的方法，包括梯度下降，包括其他的一些方法。

在使用这些方法的时候，我们要注意调整一些参数。一方面是模型的参数，另外一方面还有所谓的超参数。

调整模型参数，一方面，它的作用让我们找到真正的最小值，或者找到真正的最大值。另外一方面，避免在寻找的过程中把最小值，或者最大值，本来你是能找到的，但是这个超参数没有设计好，比如说我的步长、速率没有设计好，把这个点错过，要避免这样一些问题。所以说对于最优化而言，我们可以把它看成是目标，还有参数的一个组合，通过这两者来找到我们想要的合适的点。

三、需要掌握到什么程度？

刚才呢，我们结合这些实例，解释了线性代数，概率论，概率学统计，还有最优化，在机器学习当中的一些作用。接下来我们来看一看，需要掌握到什么程度。需要掌握到什么程度呢？实际上，应该说是一个见仁见智的问题。当然理想的情况肯定是掌握得越多越好，最好你能把所有的数学都掌握到，不光是我们提到的这些，甚至更加高级的你都会，这是最好的效果。当然在实际当中，我们不可能，没有那么多精力去专门地钻研到这个数学当中，所以说这种理想的情况也是不存在的。那么具体来说，掌握到什么程度呢？

（1）机器学习的三重境界

1. 能使用：利用已知方法解决问题

我在这里列出来了三个阶段。第一个阶段呢，我管它叫做能使用。也就是说，给定一个模型，我能够用它来根据给定的输入来求解输出，也就是利用已知的方法来解决问题。那么这个已知的方法，我可以把它看成一个黑箱子，我不关注这个过程，不关注这个方法是如何解决问题，只要能够解决问题就行。可能已经有了一个算法，那么我只需要对数据做一些处理，把这个数据送入到算法当中，得到一个输出，我能看明白这个输出是怎么回事，这就可以。这是能使用的阶段，我只是做一个算法的使用者，我能把它用清楚就够了。

2. 能看懂：理解已知方法的工作原理

如果在能使用的基础上再进一步，那么就是能看懂，我不光用这个已知的方法来解决问题，同时我还能够理解这个方法的工作原理。知其然，还能知其所以然。能使用就是知其然，能看懂就是知其所以然。那么这个方法可能背后有一些数学推导，会涉及到一些概率，最优化，还有线性代数的一些使用。那么这个能看懂，就要求你具备相关的知识，能够把这个推导的过程给它顺下来，知道这个方法具体是怎么来工作。

3. 能设计：根据问题特征开发新方法

如果在这个能看懂的基础上，再进一步的话，我们可以把它叫做能设计。我把已知方法理解之后，我还可以根据我的问题，根据我自己的实际问题的特点，来开发一些新的方法。要么呢，可以对已知的方法我来做一些改进，使它更符合我自己的一个待解决问题的方法，或者说我开发一个完全新的方法，就是重新推导，推倒重来，直接设计一个新的方法。那么很显然，这个呢，对于数学功底就有更深层次的一个要求。

所以我们说对于数学的掌握程度包括这样的三个层次，能使用，能看懂，还能设计。那么具体在实际当中，你需要做到哪个程度，那么就要根据自己的实际情况来做出判断。

四、如何尽快、高效率掌握数学知识？

（1）掌握核心概念

在这方面，我给出的建议是，一方面是，我们要握核心概念，在线性代数当中核心概念是什么？就是线性空间，向量矩阵以及对于向量矩阵的度量，包括范数、包括内积这些，这些就是它的核心概念。那么在概率统计当中，频率学派，还有贝叶斯学派，他们两者之间的区别是一个核心概念，同时呢，像期望方差这些指标，还有条件概率，这样的一些概念，条件概率联合概率这样一些概念也是核心概念。那么在最优化当中，这些算法，这个梯度下降法，或者牛顿法，这就是核心概念。

（2）以点带面

在时间有限的情况下，我们一定要把有限的精力集中在重要的知识上。先把这些核心概念搞清楚，再通过这些核心的概念，来以点代面，从这些关键的问题去铺开，慢慢地去接触其他的问题。

（3）问题导向

最后一点呢，我觉得，在学习的时候，我们可以以问题为导向，就是结合着我们实际的需求，结合我们实际的问题，来决定我们去学什么。这个呢，和我们前面所说到的这个掌握到什么程度也是一样，掌握到什么程度也是相通的。因为毕竟我们学习，机器学习，学习机器学习当中的数学都是为了解决问题。如果不能解决问题的话，你学到的这个东西的价值就没有能够解决问题的这个知识的价值大。当然我们也不能说一点价值都没有。在学习的时候，大家可以尝试着以问题为导向。带着问题去探索这些知识，带着问题去学习知识，可能你会发现，这样会得到更高的效率。

五、推荐书目

推荐书目在我们专栏里面也有相应的推送。在基础数学，基础学习，神经网络，还有深度学习，每个模块我们结束之后都会推荐一些相关的书籍。但是在这里，我想要跟大家推荐的两本书，都是关于机器学习，或者说都是关于统计学习，一本叫 An Introduction Statistical to Learning ，另一本叫 The Elements of Statistical Learning 。

两本书的作者是同一拨人，有两个共同的作者。它们讲述的都是统计学习，或者机器学习的方法。其中前一本可以看成是后一本的简化版。它更通俗、更简单一些，后面这个稍微有些难。为什么推荐这两本呢？因为这两本，它更深入的会挖掘方法背后的一些数学含义。我们能够看到的教科书，它主要的作用是把这个方法讲清楚。来了个方法，比如说线性回归，怎么推导，怎么区算，一大堆公式写出来，那么给出一个推导的结果，或者说决策树，或者其他的算法都一样，可能到这里就结束了，我的任务就完成了。

这两本书，它不光是介绍方法推导，它可能更看中统计学上的意义。我们为什么要这么做，我们设计这个方法在统计学上有什么意义。因为作者都是统计学家，有几十年的积淀，有几十年的研究积淀，所以，相比于其他市面上教科书，我认为他们两个 insight 可能更多一些。当然了，大家看起来，也会有相应的难度，可能并不是像我们平时的教科书那么简单。这些书，我们一遍两遍是读不完的，如果真正要从事人工智能、机器学习这方面的工作的话，可能要多读几遍，每读一遍也会有不同的收获。

数学基础知识蕴含着处理智能问题的基本思想与方法，也是理解复杂算法的必备要素。今天的种种人工智能技术归根到底都建立在数学模型之上，要了解人工智能，首先要掌握必备的数学基础知识，具体来说包括：

线性代数：如何将研究对象形式化？

概率论：如何描述统计规律？

数理统计：如何以小见大？

最优化理论：如何找到最优解？

信息论：如何定量度量不确定性？

形式逻辑：如何实现抽象推理？

01 线性代数：如何将研究对象形式化

事实上，线性代数不仅仅是人工智能的基础，更是现代数学和以现代数学作为主要分析方法的众多学科的基础。从量子力学到图像处理都离不开向量和矩阵的使用。而在向量和矩阵背后，线性代数的核心意义在于提供了⼀种看待世界的抽象视角：万事万物都可以被抽象成某些特征的组合，并在由预置规则定义的框架之下以静态和动态的方式加以观察。

着重于抽象概念的解释而非具体的数学公式来看，线性代数要点如下：线性代数的本质在于将具体事物抽象为数学对象，并描述其静态和动态的特性；向量的实质是 n 维线性空间中的静止点；线性变换描述了向量或者作为参考系的坐标系的变化，可以用矩阵表示；矩阵的特征值和特征向量描述了变化的速度与方向。

总之，线性代数之于人工智能如同加法之于高等数学，是一个基础的工具集。

02 概率论：如何描述统计规律？

除了线性代数之外，概率论也是人工智能研究中必备的数学基础。随着连接主义学派的兴起，概率统计已经取代了数理逻辑，成为人工智能研究的主流工具。在数据爆炸式增长和计算力指数化增强的今天，概率论已经在机器学习中扮演了核心角色。

同线性代数一样，概率论也代表了一种看待世界的方式，其关注的焦点是无处不在的可能性。频率学派认为先验分布是固定的，模型参数要靠最大似然估计计算；贝叶斯学派认为先验分布是随机的，模型参数要靠后验概率最大化计算；正态分布是最重要的一种随机变量的分布。

03 数理统计：如何以小见大？

在人工智能的研究中，数理统计同样不可或缺。基础的统计理论有助于对机器学习的算法和数据挖掘的结果做出解释，只有做出合理的解读，数据的价值才能够体现。数理统计根据观察或实验得到的数据来研究随机现象，并对研究对象的客观规律做出合理的估计和判断。

虽然数理统计以概率论为理论基础，但两者之间存在方法上的本质区别。概率论作用的前提是随机变量的分布已知，根据已知的分布来分析随机变量的特征与规律；数理统计的研究对象则是未知分布的随机变量，研究方法是对随机变量进行独立重复的观察，根据得到的观察结果对原始分布做出推断。

用一句不严谨但直观的话讲：数理统计可以看成是逆向的概率论。数理统计的任务是根据可观察的样本反过来推断总体的性质；推断的工具是统计量，统计量是样本的函数，是个随机变量；参数估计通过随机抽取的样本来估计总体分布的未知参数，包括点估计和区间估计；假设检验通过随机抽取的样本来接受或拒绝关于总体的某个判断，常用于估计机器学习模型的泛化错误率。

04 最优化理论：如何找到最优解？

本质上讲，人工智能的目标就是最优化：在复杂环境与多体交互中做出最优决策。几乎所有的人工智能问题最后都会归结为一个优化问题的求解，因而最优化理论同样是人工智能必备的基础知识。最优化理论研究的问题是判定给定目标函数的最大值（最小值）是否存在，并找到令目标函数取到最大值（最小值）的数值。如果把给定的目标函数看成一座山脉，最优化的过程就是判断顶峰的位置并找到到达顶峰路径的过程。

通常情况下，最优化问题是在无约束情况下求解给定目标函数的最小值；在线性搜索中，确定寻找最小值时的搜索方向需要使用目标函数的一阶导数和二阶导数；置信域算法的思想是先确定搜索步长，再确定搜索方向；以人工神经网络为代表的启发式算法是另外一类重要的优化方法。

05 信息论：如何定量度量不确定性？

近年来的科学研究不断证实，不确定性就是客观世界的本质属性。换句话说，上帝还真就掷骰子。不确定性的世界只能使用概率模型来描述，这促成了信息论的诞生。

信息论使用“信息熵”的概念，对单个信源的信息量和通信中传递信息的数量与效率等问题做出了解释，并在世界的不确定性和信息的可测量性之间搭建起一座桥梁。

总之，信息论处理的是客观世界中的不确定性；条件熵和信息增益是分类问题中的重要参数；KL 散度用于描述两个不同概率分布之间的差异；最大熵原理是分类问题汇总的常用准则。

06 形式逻辑：如何实现抽象推理？

1956 年召开的达特茅斯会议宣告了人工智能的诞生。在人工智能的襁褓期，各位奠基者们，包括约翰·麦卡锡、赫伯特·西蒙、马文·闵斯基等未来的图灵奖得主，他们的愿景是让“具备抽象思考能力的程序解释合成的物质如何能够拥有人类的心智。”通俗地说，理想的人工智能应该具有抽象意义上的学习、推理与归纳能力，其通用性将远远强于解决国际象棋或是围棋等具体问题的算法。

如果将认知过程定义为对符号的逻辑运算，人工智能的基础就是形式逻辑；谓词逻辑是知识表示的主要方法；基于谓词逻辑系统可以实现具有自动推理能力的人工智能；不完备性定理向“认知的本质是计算”这一人工智能的基本理念提出挑战。

责任编辑：ct

阅读全文

神经网络(98386) 神经网络(98386)
算法(90512) 算法(90512)
机器学习(130423) 机器学习(130423)

分享一些最常见最实用的机器学习算法

在这篇文章中，分享一些最常用的机器学习算法。

2017-10-14 14:24:00

8793

25个机器学习面试题，你都会吗？

算法涉及到一些对矩阵的操作，例如矩阵乘法和求逆矩阵。请给出一个简单的数学证明，说明为什么这种机器学习算法的 mini-batch 版本可能比在整个数据集上进行训练的计算效率更高？（提示：矩阵乘法的时间

2018-09-29 09:39:54

学习ARM中,曾经哪一个问题让你很难搞.

遇到了哪一些问题,曾经让你搞了很久才搞定.比如选开发板比如书籍的选择比如某次的调试..............

2012-01-17 15:51:33

学习单片机的一些看法

学习。也似乎这才到了单片机比较难的部分吧，突然就像到了一个没有人指引的地方一样，一切都突然间的变得很难了，自己也花了一些的时间去写了一个秒表的程序，有六十多句吧，兴奋了很长的时间，可兴奋后，又不

2013-03-30 21:03:18

学习嵌入式需要具备什么条件?

学习嵌入式需要具备什么条件? 这是诸多小白欲学习时经常向大牛咨询的问题，只怕走错道，走弯道。作为嵌入式的学习者，其次具备一些基础条件之后，学习嵌入式显然会事半功倍。那么今天在这里主要跟大家讲到这几

2022-12-21 15:08:20

学习机器视觉要学习哪一门语言？

马上要进行机械视觉的学习。想问一下大佬们关于机械视觉，我要学习哪一门语言？c 还是Python 还是Java或者说是嵌入式。选哪一个？对以后机械视觉的课题研究帮助更大？在线等，很急

2019-04-15 15:30:38

机器人技术和机器学习

基于可靠性和安全性的多核片上系统（SoC）架构。因此，嵌入式系统行业似乎将进入两个关键领域：智能和自治。一些感兴趣的领域是机器学习和所谓的“物联网机器人”。在机器...

2021-12-20 06:03:10

需要注意的一些FPGA学习误区【经验贴】

`需要注意的一些FPGA学习误区 1、不熟悉 FPGA的内部结构，不了解可编程逻辑器件的基本原理。 2、错误理解 HDL语言，怎么看都看不出硬件结构。3、FPGA本身不算什么，一切皆在FPGA之外

2012-02-27 15:10:40

Altium的DRC常用的设置有哪一些呢？

，间距等等规则约束。接下来我们就来讲讲常见的DRC设置有哪一些。1. 快捷键TD或者在工具-设计规则检查，打开DRC规则设置对话框：（图文详解见附件）

2019-11-29 15:02:45

FPGA学习的一些误区

2012-08-12 11:46:16

FPGA学习的一些误区

FPGA学习的一些误区这是网上一篇非常不错的文章，虽然很长，但还是希望大家能耐心看完，我想对初学者还是很有帮助的！因为很多刚刚开始学习FPGA的朋友们都可能会遇上这样的问题。1、不熟悉FPGA

2017-03-13 15:31:16

FPGA学习的一些误区

设备等。当现有芯片无法满足系统的需求时，就需要用FPGA来快速的定义一个能用的芯片。前面说了，FPGA里面无法就是一些“真值表”、触发器、各种连线以及一些硬件资源，电子系统工程师使用FPGA进行设计时

2013-09-24 11:45:45

NRF24l01在其他32单片机最小系统版修改失败

总是检测不到2401模块，自己不知道应该修改哪一些地方

2020-04-23 04:35:56

TFT屏幕显示一些图形

TFT屏幕显示一些图形，图形的数学函数有木有啊？

2014-09-24 21:16:18

stm32的库开发和寄存器开发哪一个对小白更友好一些呢

新手上手STM32是学习库开发还是寄存器开发呢？stm32的库开发和寄存器开发哪一个对小白更友好一些呢？

2021-11-30 06:59:15

ucos学习的一些资料

2016-10-12 22:41:05

【下载】《机器学习》+《机器学习实战》

读者, 本书附录给出了一些相关数学基础知识简介.目录：全书共16 章，大致分为3 个部分：第1 部分（第1～3 章）介绍机器学习的基础知识；第2 部分（第4～10 章）讨论一些经典而常用的机器学习

2017-06-01 15:49:24

人工智能和机器学习的前世今生

，并将人类决策过程编码成算法。这些算法可以被应用到几个实例以得出有意义的结论。在这篇文章中，我们将了解一些机器学习的基础、工作原理及特点。举例来了解机器学习经研究预测，截至到2020年，企业采用机器学习

2018-08-27 10:16:55

什么是机器学习? 机器学习基础入门

工程师在数据收集过程中使用标签对数据集进行分类数据收集和标记是一个耗时的过程，但对于正确处理数据至关重要。虽然机器学习领域有一些创新，利用预先训练的模型来抵消一些工作和新兴的工具来简化从实际系统

2022-06-21 11:06:37

介绍一下labview机器视觉怎么实现一些零件尺寸的测量。

本帖最后由 forgiveroc 于 2016-9-10 18:25 编辑 RT，针对入门，高手多多指教呀~。断断续续的学习了一下labview机器视觉，做了一些简单的案例，在这里分享一下经验

2016-03-12 16:36:24

介绍学习Linux的一些建议

一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实

2018-08-18 02:17:57

作为小白，我应该学习f4的哪一些知识？

对于学习四轴的小白来说，我应该学f4的哪一些知识，希望大神能够指点几下，能够帮我看看我应该学习哪一讲，不怕多（也希望不要全部学完，太多记不住啦），就拍漏学啦，谢谢

2019-06-11 02:58:21

使用 Python 开始机器学习

在这篇文章中我们会讲Python的重要特征和它适用于机器学习的原因，介绍一些重要的机器学习包，以及其他你可以获取更详细资源的地方。为什么用Python做机器学习Python很适合用于机器学习。首先

2018-12-11 18:37:19

做智能座便器需要过哪个安规认证及电磁兼容测试呀

本公司近来开始做产品，主要是智能坐便器，现在已开发出一款直热式的坐便器，样品已出，正准备试产。本产品内部有一个开关电源，用单片机控制光耦器再控制220V市电供电的发热丝。请问这样的产品需要做一些什么测试呀，需要通过哪一些标准。请前辈们指点一下。

2011-07-27 08:56:18

傅里叶的一些总结

最近在学习傅里叶变换应用在电网上的谐波分析，于是就看了一些资料，相信想要把傅里叶应用在工程上的工程师很多，但是有些时候被一些数学公司搞蒙了，我把最近看的几篇通俗易懂的文章发上来，与大家分享下，还有工程上常用的算法，在附可下载。

2014-10-06 11:08:21

元件库的一些东西放哪一层

请问做单面板元件库时元件面的丝印和焊接面的丝印分别放在哪一层?一些注解文字放在哪一层?

2011-12-13 13:59:13

关于keil的一些学习资料

本帖最后由 eehome 于 2013-1-5 09:45 编辑关于keil的一些学习资料。

2012-10-30 00:19:46

分享一些学习STM32的内容

这里大概的罗列了一些学习STM32的内容，以及学习顺序。如果是新手的话，建议边看中文手册和学习视频(一般都看原子的，视频的话百度就可以了，如果实在是找不到的话，我给大家推荐一个网站：21ic公开课

2021-11-22 08:19:03

分享些自己学习单片机用到的一些好的学习资料

2012-06-27 13:38:54

单片机怎么用红外线来控制家庭电路的开关？

我要学习单片机哪一些内容。怎么实现。希望各位大神给予我一些建议

2016-09-05 15:57:31

压电式传感器在日常生活中有哪一些应用可以用来做毕业设计？

压电式传感器在日常生活中有哪一些应用可以用来做毕业设计？我自己有去了解了一些，像电子体重秤，血压计，应变仪，点火器、汽车安全气囊。有没有新颖的，适合做毕业设计而且成本不怎么高那种。感谢大佬们的帮忙！

2018-11-02 15:50:36

又开始了新一年的大赛

你们会做哪一些，感觉信号150兆的有点高嘞！

2015-08-12 12:37:32

如何使用Windows机器来使用一些用于实验室设备

我目前使用MacBook Pro做任何事情，但是最近遇到了一些问题，我真的需要一台Windows机器来使用一些用于实验室设备和其他东西的特定软件。我一直在使用VMWare Fusion来运行那些东西

2020-04-30 14:21:48

如何规划出完美的机器学习入门路径？| AI知识科普

学习实战应用一切的学习都是以实际应用为导向的。大家经历了前三个步骤的学习积累，基本上该掌握的理论和算法都已经掌握了，这一阶段该做的就是去实际做一些项目，将之前所学的知识融会贯通。好啦~今晚的课程就到这里了。咱们「AI大学移动端」已经将【机器学习】的视频课程上线了~小伙伴们记得关注哦。

2018-07-27 12:54:20

如果只是应用机器学习，而不是研究，需要哪些知识

如果只是应用机器学习，而不是研究，需要哪些知识？还用深入学习数字么

2019-08-30 14:51:02

工程电磁场应具备哪些数学知识

我是一名大二学生，专业是电气工程及其自动化，最近学习了工程电磁场，发现有许多数学知识是高等数学中未有的，希望各位学习过的大师们，帮帮我我还应该学习哪些数学知识以及看哪些相关的书籍。万分感谢

2013-03-30 18:49:45

常用python机器学习库盘点

现在人工智能非常火爆，机器学习应该算是人工智能里面的一个子领域，而其中有一块是对文本进行分析，对数据进行深入的挖掘提取一些特征值，然后用一些算法去学习,训练,分析,甚至还能预测，那么Python中常

2018-05-10 15:20:21

想学习一些机器人控制方面的工作，要学习什么内容！

本人应届毕业生一枚，即将从事机器人方面工作，想学习一些机器人控制，变成方面的知识

2015-11-20 15:21:47

想学习arm，求各位大牛推荐一些什么好书

2013-08-06 12:45:23

想了解labVIEW系统级的一些编程

。问题：1，我想了解怎样才能把各个vi的界面和后面板程序组织到一起。我要学习哪一方面的类容。2，各个vi之间的调用方法要学习哪一些知识。现在自己学的都比较基本，不知道到系统以后该学习哪一些知识，希望大家给些引导性的指教。谢谢！

2015-09-21 09:17:19

新人求一些关于ARM学习的一些经验

，之后不知道从何学起，最近买了一本C++谭浩强的书准备学一下之后准备接触数据结构在学习ARM，看了一些有经验的人发的帖子不知道自己应该接触嵌入式硬件还是嵌入式软件还有ARM7跟ARM9的一些

2015-06-22 20:06:10

最近学习LABVIEW，分享一些找到的资料

最近学习LABVIEW，找的一些资料

2015-05-25 23:48:03

有关FPGA学习的一些资料

2015-12-03 22:32:54

构建机器学习产品必需的数学背景

必读我们该如何学习机器学习中的数学

2019-08-15 11:44:25

求大佬分享一些System Verilog的学习经验

2021-06-21 06:29:54

求大神分享一些关于Altium Designer的学习笔记

请求大神分享一些关于Altium Designer的学习笔记

2021-04-21 07:00:15

求大神分享一些关于FPGA设计的学习经验

请求大神分享一些关于FPGA设计的学习经验

2021-04-15 06:47:08

罗列一些学习STM32的内容以及学习顺序

2022-01-19 07:04:27

请教关于学习DSP的一些问题

我是专科专业是应用电子技术，懂C 会一些STM32编程想学习DSP请问需要有哪些基础？要会算法？数学基础要特别好？请论坛里的前辈、高手或是正在学习DSP的坛友解答一下，谢谢！

2016-09-23 11:38:46

请问哪一种接法好一些？

ADS62P49和DAC5682Z各自的AGND、DGND管脚应该分别接到系统的模拟地、数字地，但查资料时发现也建议将AGND、DGND连到一块接到系统的模拟地，哪一种接法好一些？？

2019-06-12 09:07:31

请问学习LLC电源需要掌握一些什么知识点

我是一个刚学习电源的萌新，请问学习LLC电源需要掌握一些什么知识点

2019-03-05 21:42:33

请问AD8138的负电压可以由哪一些负电压芯片提供？

目前需要用AD8138作为AD9288的驱动，AD8138工作需要正负电源，正电源已经解决，负电源目前选用7660负电压转换器，发现7660不能满足AD8138的功率需求，请问AD8138的负电压可以由哪一些负电压芯片提供，有没有推荐的电源芯片。

2023-11-27 06:25:02

请问C2000器件实时控制应用有哪一些？

本帖最后由一只耳朵怪于 2018-6-11 14:50 编辑 C2000 器件非常适合于实时控制应用，主要应用有哪一些？

2018-06-11 02:00:32

请问嵌入式系统的常用仪器有哪一些？

主要做网络播放器、机顶盒系统的集成和维护等，请问常用到的仪器有哪些？必须要的我能想到的是示波器、万用表示波器的话，一般要选多少带宽的？还要看其他什么指标？万用表有什么好的推荐？ fluck 15b？还必须要的仪器有哪些啊？公司刚成立研发，准备买一些仪器和工具。

2019-10-28 09:00:24

请问能分享ROS机器人操作系统的一些资料吗？

菜鸟想要学习ROS机器人操作系统，但是没能找到系统的资料，请问有哪位大神研究过，可以分享一些资料吗？跪谢了！！！！！！！！！

2019-02-19 23:14:23

请问高压套件2.1中28335无传感器例程include选项需要做哪一些修改？

您好，关于高压套件2.1中28335无传感器例程：1、这个例程在用28335主控制器的时候，是不是要把该例程中的所有关于28035的更换为28335的？2、include选项需要做哪一些修改？3、我

2018-09-07 11:24:13

软件测试从业者需要具备哪些技能

软件测试工程师需要具备哪些基本能力?相信这些问题是很多刚刚入行学习软件测试的新手们疑惑且急于想要了解的。为此，信盈达小编简单的总结了一些软件测试工程师需要具备的点，希望对刚学习软件测试的人有所帮助

2021-07-16 16:22:27

软件测试从业者需要具备哪些技能

2021-11-23 10:00:25

闲聊一些与编程相关的东西

目录前言一、编程工作的演进史二、程序员、编译器、CPU之间的三角恋前言本篇文章主要闲聊一些编程相关的东西，包括发展史，学习方法之类的。一、编程工作的演进史1、CPU需要的只是1和0组成的二进制数据

2022-02-14 06:54:23

机器学习中所需要的数学知识介绍

数学和代码在机器学习研究中通常是高度混合的。大多数情况下，代码都是直接从数学逻辑中形成，并且能用代码语法展示出数学表示法。其实现在一些数据科学框架（例如NumPy）就能直接将数学推理（例如矩阵或向量）转换成可读代码，非常直观高效。

2018-08-05 09:00:20

4050

如何搞定做机器学习研究需要的数学？

有人说，概率论线性代数要预先精通；有人说，微积分要懂一点；也有人说，没必要特地去补；甚至有人专门写了绕开数学的深度学习入门教材。

2018-08-20 14:24:25

2500

机器学习不需要数学，调包就行？

大部分机器学习从业者不需要过度的把时间精力放在数学上，而该用于熟悉不同算法的应用场景和掌握一些调参技巧。好的数学基础可以使你的模型简洁高效，但绝非必要的先决条件。

2018-09-30 10:38:20

5095

机器学习中应用数学应该要注意的几点注记

本章讨论的主题是我觉得在应用机器学习（和其他地方）中经常假设的，但是很少详细解释。这项工作是针对学生谁采取了一些线性方法和分析的课程，但谁想看到一些技巧使用的研究人员讨论更详细一些。这里描述的数学

2018-11-16 16:17:37

机器学习所需的数学知识你能够有效使用吗

开始机器学习之旅，需要什么层次的数学功底？尤其是对于那些没有学过数学和统计学的同学们来说，这个问题当前不甚清楚，在这篇文章中，我将要为那些使用机器学习技术来开发产品或做学术研究的人们提供一些数学背景方面的建议。

2019-02-02 17:10:00

1737

人工智能时代，需要具备的数学基础

随着科技的快速发展，数据科学也应运而生。大数据时代的到来，机器学习、深度学习日益凸显其优势、越来越具有可行性。而随着人工智能的迅速窜热，也有很多人投身于这一行。人工智能正前所未有的占据着我们的视线

2019-06-29 11:46:28

1292

机器学习有哪一些算法

机器学习（Machine Learning， ML）是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2019-07-08 10:05:05

721

沉铜有哪一些常见的问题以及如何去解决

沉铜有哪一些常见的问题以及如何去解决

2019-12-21 11:38:15

6272

PCB常用的度量衡单位有哪一些

PCB常用的度量衡单位有哪一些

2019-10-25 17:18:12

5617

导致PCB组装的常见错误有哪一些

导致PCB组装的常见错误有哪一些

2019-09-08 12:38:00

3783

如果要从事机器学习方面的研发，可以按照以下几个步骤学习

具备软件开发能力的程序员，转向机器学习领域会更容易一些，但是即使没有软件开发基础，如果具备扎实的数学基础以及较强的学习能力，也完全可以从头开始学习。对于没有软件开发基础的人来说，如果要从事机器学习方面的研发，可以按照以下几个步骤学习：

2019-09-20 10:26:03

2988

嵌入式学习需要具备哪一些知识的基础

c语言也被称为是上帝的语言，那么在嵌入式驱动当中是使用最广泛的语言开发。

2019-10-11 15:05:41

668

智能语音机器人具备哪一些优点

电销机器人可以在使用中，应用业务数据进行自学习，越用越聪明，外呼效果在不久的将来可以达到甚至超过人工水平。

2019-11-12 15:23:26

2452

部署WIFI6的时候需要考虑哪一些问题

利用人工智能和机器学习将代表Wi-Fi流量管理的一个巨大飞跃，提供分析，IT架构师可以用自动化来采取先发制人的行动。

2019-11-18 10:36:15

1212

工业机器人具备有哪一些优势

虽然机器人发展优势十分明显，不过随着机器人的广泛应用，我国的机器人技术人员却十分匮乏。

2019-11-27 11:07:10

4868

M2M应用设计具备哪一些特性

随着接入互联网的机器（Machine）数量的增多，甚至超过互联网使用的人数。

2019-12-10 15:58:26

761

机器学习有哪一些教训值得知道

机器学习算法是从历史场景中自动简化的技术。它们有能力在更大的数据量和更快的速度上进行泛化。

2019-12-28 10:05:23

689

哪一些机器学习用例值得去关注

机器学习是人工智能的一个应用，它使用算法和统计模型来教计算机系统如何在没有任何人工交互的情况下执行各种任务。

2020-02-25 14:41:50

3224

人工智能大规模的落地需要避过哪一些坑

人工智能具备不断自我学习的能力，也可以产生开箱即用的想法。

2020-02-27 11:22:20

442

2020的机器学习将会引领哪一些潮流

机器学习可以定义为对主要依赖模式和推理的统计模型和复杂算法的科学研究。该技术不用依赖任何明确的指示就可以使用，这是其优点。

2020-03-14 09:22:33

328

人们需要了解人工智能和机器学习哪一些事情

使人工智能、机器学习和深度学习成为可能的是数据量和数据类型的激增，加上计算和存储硬件和工具的成本降低。

2020-03-14 10:54:15

472

需要了解哪一些神经网络架构

机器学习方法如下：它没有为每个特定的任务编写相应的程序，而是收集大量事例，为给定输入指定正确输出。

2020-03-30 09:41:01

333

机器学习算法都有哪一些

降维是机器学习另一个重要的领域，降维有很多重要的应用，特征的维数过高，会增加训练的负担与存储空间，降维就是希望去除特征的冗余，用更加少的维数来表示特征。

2020-03-30 09:53:32

2056

AI全栈全场景开发具备哪一些可能

直到近年来云计算、大数据、机器学习等相关技术的崛起，人工智能才迎来了新一轮高速发展。

2020-03-30 10:44:52

717

智慧城市需要哪一些AI技术的融合

通过机器学习训练的算法，可以分析卫星图像以进行城市规划和发展，并根据变化的数据，在易发生洪水，地震和暴风雨等自然灾害的区域来调整建筑设计。

2020-04-13 16:36:31

1226

机器学习的成功应用需要具备哪些能力和技能？

但是，正如许多IT主管说的那样，采用新技术可能会导致一些不切实际的期望。为此，一些机器学习和数据科学专家分享了企业和团队在采用机器学习技术时需要吸取的经验和教训。

2020-08-12 11:19:55

936

机器视觉需要哪些基础_机器视觉行业发展前景

要学习机器视觉，需要具备以下知识和技能：　　数学基础：机器视觉需要用到很多数学知识，如线性代数、微积分、概率论、统计学等，需要具备这些数学基础知识。　　编程语言：机器视觉需要用到一些编程语言，如Python、C++、MATLAB等，需要熟练掌握至少一种编程语言。

2023-03-12 17:06:46

1519

fpga学习需要具备哪些课程

FPGA（Field Programmable Gate Array）学习需要具备一系列的课程知识和实践技能

2024-03-14 15:51:31

126

已全部加载完成

搜索历史

机器学习需要具备哪一些数学基础

评论