统计学对于机器学习有什么作用

统计学和机器学习是两个密切相关的领域。实际上，两者之间的界限有时可能非常模糊。但是，有一些方法显然属于统计领域，不仅在机器学习项目中有用，而且非常有价值。可以公平地说，需要统计方法才能有效地通过机器学习预测建模项目工作。

统计学是先决条件

机器学习和统计学是两个紧密相关的研究领域。因此许多统计学家将机器学习称为“ 应用统计学 ”或“ 统计学习 ”，而不是以计算机科学为中心的名称。

所有的机器学习初学者都应该学习一点统计学的知识。下面有几个精心挑选的例子来具体说明。

从一本流行的应用机器学习书《 Applied Predic tive Modeling 》的开头看一下这句话：

… the reader should have some knowledge of basic statistics， including variance， correlation， simple linear regression， and basic hypothesis testing （e.g. p-values and test statistics）。

— Page vii， Applied Predictive Modeling， 2013

这是流行的《 Introduction to Statistical Learning 》一书中的另一个示例：

We expect that the reader will have had at least one elementary course in statistics.

— Page 9， An Introduction to Statistical Learning with Applications in R， 2013.

即使不是统计学的先决条件，也需要一些原始的先验知识，这可以从广泛阅读的“ Programming Collective Intelligence ”的引用中看出：

… this book does not assume you have any prior knowledge of ［…］ or statistics. ［…］ but having some knowledge of trigonometry and basic statistics will help you understand the algorithms.

— Page xiii， Programming Collective Intelligence： Building Smart Web 2.0 Applications， 2007.

为了能够理解机器学习，需要对统计信息有一些基本的了解。

想要知道为什么会这样，我们必须了解为什么首先需要统计领域。

为什么要学习统计？

原始观测值本身就是数据，但它们不是信息或知识。

数据引发了一些问题，例如：

最常见或最期望的观察是什么？

观察的极限是什么？

数据是什么样的？

尽管它们看起来很简单，但必须回答这些问题才能将原始观察结果转化为我们可以使用和共享的信息。

除了原始数据，我们还可以通过设计实验来收集观察数据。从这些实验结果中，我们可能会遇到更复杂的问题，例如：

哪些变量最相关？

两次实验的结果有何不同？

差异是真实存在的还是因为数据噪声产生的？

这些问题很重要。问题的答案对项目，利益相关者以及有效的决策都是至关重要的。

需要统计方法来找到关于数据的问题的答案。

我们可以看到，为了了解用于训练机器学习模型的数据并解释测试不同机器学习模型的结果，都需要统计方法。

这只是冰山一角，因为预测建模项目中的每个步骤都将需要使用统计方法。

什么是统计学？

统计学是数学的一个子领域。

它指的是处理数据和使用数据回答问题的方法的集合。

Statistics is the art of making numerical conjectures about puzzling questions. ［…］ The methods were developed over several hundred years by people who were looking for answers to their questions.

— Page xiii， Statistics， Fourth Edition， 2007.

这是因为该领域包括处理数据的方法包，对于初学者而言，它看起来像是很大的东西，而且是不确定的。很难看出属于统计方法的方法与属于其他研究领域的方法之间的界限。通常，技术既可以是统计中的经典方法，又可以是用于特征选择或建模的现代算法。

尽管统计工作知识不需要深入的理论知识，但一些重要的且易于理解的定理可以为统计和概率之间的关系提供有价值的基础。

两个例子包括大数定律和中心极限定理;第一个有助于理解为什么较大的样本通常更好，第二个则为我们如何比较样本之间的期望值（例如平均值）提供了基础。

对于我们在实践中使用的统计工具，将统计领域分为两大类方法可能会有所帮助：用于汇总数据的描述性统计和用于从数据样本中得出结论的推论统计。

Statistics allow researchers to collect information， or data， from a large number of people and then summarize their typical experience. ［…］ Statistics are also used to reach conclusions about general differences between groups. ［…］ Statistics can also be used to see if scores on two variables are related and to make predictions.

Pages ix-x， Statistics in Plain English， Third Edition， 2010.

描述统计

描述性统计指的是将原始观察汇总为我们可以理解和共享的信息的方法。

通常，我们将描述性统计视为对数据样本的统计值的计算，以便总结数据样本的属性，例如共同的期望值（例如，均值或中位数）和数据的传播范围（例如，方差或标准差）。

描述性统计信息还可能涵盖可用于可视化数据样本的图形方法。图表和图形可以对观察的形状或分布以及变量之间如何相互关联提供有用的定性理解。

推论统计

推论统计是一些方法的统称，这些方法可以帮助从较小的一组称为样本的观测值中量化域或总体的属性。

通常，我们认为推论统计是根据总体分布估算的数量，例如期望值或传播数量。

更复杂的统计推断工具可用于量化在给定假设的情况下观察数据样本的可能性。这些通常被称为统计假设检验的工具，其中检验的基本假设称为原假设。

给定我们可以假设的假设范围以及我们可能施加在数据上的约束条件，以提高检验结果正确的能力或可能性，推理性统计方法的例子很多。

统计方法在机器学习项目中的使用示例

在下面的内容中，展示了统计方法的一些特定示例，这些示例在预测建模问题的关键步骤中非常重要。可以公平地说，需要统计方法才能有效地通过机器学习方法完成预测建模的工作。

1.问题框架

在预测建模问题中较大的影响力也许就是问题的框架。

这是问题类型的选择，例如回归或分类，也许是问题的输入和输出的结构和类型。

问题的框架并不总是很明显。对于某个领域的新手，可能需要对该领域中的观察结果进行大量探索。

对于可能不从常规角度看问题的领域专家，他们也可能会从多个角度考虑数据而获取一些有用信息。

可以在问题分类期间帮助探索数据的统计方法包括：

探索性数据分析。进行汇总和可视化以探索数据的临时视图。

数据挖掘。自动发现数据中的结构化关系和模式。

2.数据理解

数据理解意味着对变量的分布以及变量之间的关系有密切的了解。

其中一些知识可能来自领域专业知识，或者需要领域专业知识才能进行解释。尽管如此，研究领域的专家和新手都将从实际处理领域问题中的实际观察有所受益。

统计方法的两个大分支用于帮助理解数据。他们是：

摘要统计。使用统计量总结变量之间的分布和关系的方法。

数据可视化。使用图表和图形等可视化方法总结变量之间的分布和关系的方法。

3.数据清理

来自某个领域的观察通常不是原始的。

尽管数据是数字的，但会受到可能破坏数据保真度的过程的影响，进而可能会影响使用该数据的任何下一步过程或模型。

一些示例包括：

数据损坏。

数据错误。

数据丢失。

识别和修复数据问题的过程称为数据清理

统计方法用于数据清理，例如：

离群值检测。识别与分布中的期望值相差甚远的观测值的方法。

归责。修复或填充观测值中损坏或缺失的方法。

4.数据选择

建模时，并非所有观察值或所有变量都可能相关。

将数据范围缩小到对做出预测最有用的那些元素的过程称为数据选择。

用于数据选择的两种统计方法包括：

数据样本。从较大的数据集中系统创建较小的代表性样本的方法。

特征选择。自动识别与结果变量最相关的那些变量的方法。

5.数据准备

数据通常不能直接用于建模。

通常需要进行一些转换，以更改数据的形状或结构，使其更适合问题的选定框架或学习算法。

使用统计方法进行数据准备。一些常见的示例包括：

缩放比例。标准化和归一化等方法。

编码。整数编码和One-hot编码等方法。

转换。诸如Box-Cox方法之类的幂变换方法。

6.模型评估

预测建模问题的关键部分是评估学习方法。

在对模型训练期间未看到的数据进行预测时，通常需要估计模型的技能。

通常，训练和评估预测模型的过程的计划称为实验设计。这是统计方法的整个子领域。

实验设计。设计系统实验以比较自变量对结果的影响的方法，例如选择机器学习算法来提高预测精度。

作为实施实验设计的一部分，使用方法对数据集进行重新采样，以便经济地利用可用数据，从而估算模型的技能。

重采样方法。为了训练和评估预测模型而将数据集系统地分为子集的方法。

7.模型超参数配置

给定的机器学习算法通常具有一整套超参数，这些超参数允许使用者根据特定问题而定制学习方法。

超参数的配置在本质上通常是经验性的，而不是分析性的，需要大量的实验才能评估不同的超参数的取值对模型效果的影响。

使用两个统计子字段之一对不同的超参数配置之间的结果进行解释和比较：

统计假设检验。给定对结果的假设或期望，量化观察结果的可能性的方法（使用临界值和p值表示）。

估计统计。使用置信区间量化结果不确定性的方法。

8.模型选择

对于给定的预测建模问题，可能有不止一个机器学习算法适合于此问题。选择一种方法作为解决方案的过程称为模型选择。这可能涉及项目利益相关者的一套标准，也包括对问题评估方法的估计技能的仔细解释。

与模型配置一样，出于模型选择的目的，可以使用两类统计方法来解释不同模型的估计技能。他们是：

统计假设检验。给定对结果的假设或期望，量化观察结果的可能性的方法（使用临界值和p值表示）。

估计统计。使用置信区间量化结果不确定性的方法。

9.模型介绍

一旦对最终模型进行了训练，就可以在使用或部署最终模型以对实际数据进行实际预测之前将其呈现给利益相关者。

呈现最终模型的一部分涉及呈现模型的估计方法。

估计统计领域的方法可用于通过使用公差区间和置信区间来量化机器学习模型的估计技能中的不确定性。

估计统计。通过置信区间量化模型技能不确定性的方法。

10.模型预测

最后，是时候开始使用最终模型对我们不知道实际结果的新数据进行预测了。

作为进行预测的一部分，量化预测的置信度很重要。

就像模型表示过程一样，我们可以使用估计统计领域的方法来量化此不确定性，例如置信区间和预测区间。

估计统计。通过预测区间量化预测不确定性的方法。

从上面的例子可以看到统计方法在整个预测建模项目过程中的重要性。探索性的数据分析，数据汇总和数据可视化可用于帮助构建预测性建模问题并更好地理解数据。统计方法可用于清理和准备用于建模的数据。统计假设检验和估计的统计数据可以在模型的选择和从最终模型展示的技能和预测帮助。

责任编辑：ct

阅读全文

人工智能(229987) 人工智能(229987)
机器学习(130423) 机器学习(130423)

25个机器学习面试题，你都会吗？

`机器学习有非常多令人困惑及不解的地方，很多问题都没有明确的答案。但在面试中，如何探查到面试官想要提问的知识点就显得非常重要了。在本文中，作者给出了 25 个非常有意思的机器学习面试问题，这些

2018-09-29 09:39:54

学单片机有前途吗?

学单片机有前途吗? 个人认为学习任何一门技术都比不学的强，针对学单片机有前途吗?那么比较对象当然就是在整个IT行业做对比。因此我们可以从职业前景、钱景、这几方面综合考量。学单片机有前途吗?我

2023-09-06 10:59:29

学习大数据开发需要哪些条件？

能力，线性代数(主要是矩阵计算相关知识)最好也有一定的了解。而对于数据挖掘工程师，除了统计学以外，各类算法也需要熟练使用，对数学的要求是最高的。2. 分析工具对于初级数据分析师，玩转Excel是必须

2018-03-01 15:42:20

对于新手如何学习Labview

求助请大家各自讨论一下对于不是电子信息专业，机电一体化专业的新手如何学习Labview，需要看一些哪些比较好的书籍、怎么学习比较容易上手、怎么练习、各位学姐学哥大师请给与指点，O(∩_∩)O谢谢！！！

2015-09-12 14:14:37

机器学习KNN介绍

机器学习(李航统计学方法)之KNN

2020-04-07 16:20:24

机器学习分类算法之支持向量机SVM

统计学习方法C++实现之六支持向量机（SVM）

2019-04-29 10:47:58

机器学习的创新/开发和应用能力

机器学习的未来在工业领域采用机器学习机器学习和大数据工业人工智能生态系统

2020-12-16 07:47:35

机器学习的未来

机器学习的未来在工业领域采用机器学习机器学习和大数据

2021-01-27 06:02:18

统计的学习方法

统计学习方法感知机

2020-07-15 10:33:49

统计学和编程题目

统计学和编程练习

2019-09-10 14:21:15

统计学的概率分布

统计学术语总结

2019-09-27 16:24:23

统计学习方法数据挖掘

统计学习方法C1概论

2019-10-29 09:12:28

CubeMX怎么使用

、掌握循环语句学习时间：提示：这里可以添加计划学习的时间例如：1、周一至周五晚上 7 点—晚上9点2、周六上午 9 点-上午 11 点3、周日下午 3 点-下午 6 点学习产出：提示：这里统计学习计划的总量例如：1、技术笔记 2 遍2、CSDN 技术博客 3 篇

2022-01-17 06:44:05

Labview机器学习

请问Labview机器学习工具箱里有SVM，BP等工具，如果自己用SVR做了一个回归，可以用Labview实现吗？这方面的小白，跟各位老师请教一下

2019-10-28 11:11:09

Python机器学习常用库

、PyMVPAPyMVPA是一种统计学习库，包含交叉验证和诊断工具，但没有Scikit-learn全面。七、TheanoTheano是最成熟的深度学习库，它提供了不错的数据结构表示神经网络的层，对线性代数来说很高

2018-03-26 16:29:41

STM32的RCC时钟树学习内容

、PCLK1时钟、PCLK2时钟、RTC时钟、MCO时钟、学习时间：提示：这里可以添加计划学习的时间例如：1、周一至周五晚上 7 点—晚上9点2、周六上午 9 点-上午 11 点3、周日下午 3 点-下午 6 点学习产出：提示：这里统计学习计划的总量例如：1、技术笔记 2 遍

2021-08-11 08:59:15

stm32实现esp8266的AT指令学习内容

：提示：这里可以添加计划学习的时间例如：1、周一至周五晚上 7 点—晚上9点2、周六上午 9 点-上午 11 点3、周日下午 3 点-下午 6 点学习产出：提示：这里统计学习计划的总量例如：1、技术笔记 2 遍2、CSDN 技术博客 3 篇3、学习的 vlog

2021-11-29 06:27:38

【下载】《机器学习》+《机器学习实战》

尽可能少地使用数学知识. 然而, 少量的概率、统计、代数、优化、逻辑知识似乎不可避免. 因此, 本书更适合大学三年级以上的理工科本科生和研究生, 以及具有类似背景的对机器学习感兴趣的人士. 为方便

2017-06-01 15:49:24

【转载】如何从零入门人工智能（AI）具体学习步骤和方法

，涉及概率论、统计学、算法复杂度等多门学科。是AI的核心，是使计算机具有智能的根本途径。后续就可以学习如下图所示的内容。（5）实际项目试炼人工智能的学习过程，不能缺少实际项目应用的操作。当你深度学习都

2019-11-28 16:20:53

一名数据挖掘工程师给新人整理的入门资料

的《统计学习方法》可以作为机器学习入门书籍，经典教材《Pattern Recognition and Machine Learning》可以作为机器学习进阶书籍，而《机器学习实战》一书能手把手地教你

2017-09-01 11:05:58

一种基于统计学和模糊控制理论的权控智能节水系统设计

、集成化、智能化方向发展。基于此，设计了一种基于统计学和模糊控制理论的权控智能节水系统。它利用改进的红外检测单元准确地采集数据；以AT89C2051单片机为硬件平台构建信号处理、控制的主控制器，对检测数据

2019-07-15 06:30:47

为什么要学MCU？学习MCU有什么技巧？

2021-09-27 06:41:19

人工智能机器学习程序可分析患者肺癌肿瘤影像

。据羿戓信息所了解，研究者设计了统计学方法让他们的程序可以学习如何更好地完成指令，这些程序建立规则和算法模型可以基于数据样本做出决策，训练数据越多程序就变得越聪明。研究者用Google＇s

2018-11-08 06:45:00

人工智能和机器学习的前世今生

本身与统计学的原理密切相关，但是R作为机器学习语言可以带来巨大的好处。如果你希望在大数据中解决模式问题，R语言是最佳选择，它是由统计学家和科学家设计的，很方便地用于数据分析。机器学习算法的工作原理机器

2018-08-27 10:16:55

什么是机器学习? 机器学习基础入门

工程师在数据收集过程中使用标签对数据集进行分类数据收集和标记是一个耗时的过程，但对于正确处理数据至关重要。虽然机器学习领域有一些创新，利用预先训练的模型来抵消一些工作和新兴的工具来简化从实际系统

2022-06-21 11:06:37

使用 Python 开始机器学习

的运行速度跟它的低层语言实现的运行速度相比拟的。你没有必要担心程序的运行速度。值得知道的Python程序库Scikit-learn你刚开始学机器学习吗？如果你需要一个涵盖了特征工程，模型训练和模型测试所有

2018-12-11 18:37:19

医学研究中的统计技术

，对于配对设计的均值比较，可以看成是样本均值与总体均数的比较，也就是建立配对检验统计量t进行统计推断。在此，笔者不想赘述教科书上的统计学基本概念及其思想原理，而是想借用一个实际案例来强调如何使统计

2009-09-17 14:53:07

十大Python机器学习常用库

这些框架，高效开发。这些应用程序可在浏览器和移动设备中使用。6. PyFluxPyFlux 是专门针对时间序列开发的 Python 开源库。时间序列研究是统计学和经济学的子领域，其目的是用于描述时间

2018-05-02 16:37:14

如何规划出完美的机器学习入门路径？| AI知识科普

。机器学习是一种计算机程序，可以从现有的经验中学习如何完成·某项任务，并随着经验的增加，性能也会随着提升。这里的经验也就是所谓的数据，对于机器学习来说，数据库的大小对结果起决定性作用。根据训练方法

2018-07-27 12:54:20

寻一本电子书

想找一本Vapnik的统计学习理论的中文版电子书，希望可以分享

2014-06-07 23:33:25

数据分析需要的技能

探索以及预测都需要用到统计学，因此，具有扎实的统计学理论知识储备也是必不可少的！分析历史、预测未来、优化选择是大数据工程师在“玩数据”时的三大任务，对于一个想有更好的发展前景的数据分析师来说，光具备以上

2018-04-10 15:59:14

最值得学习的机器学习编程语言

如果你对人工智能和机器学习感兴趣，而且正在积极地规划着自己的程序员职业生涯，那么你肯定面临着一个问题：你应该学习哪些编程语言，才能真正了解并掌握 AI 和机器学习？可供选择的语言很多，你需要通过战略

2021-03-02 06:22:38

李航统计学习第五章之决策树

李航统计学习第五章-决策树

2020-04-29 15:12:25

欧姆社(OHM)漫画系列, 机器人竞技系列,实用手册系列图书

漫画系列漫画热力学漫画测量漫画电学原理漫画密码漫画数据库漫画统计学之因子分析漫画微分方程漫画微积分漫画统计学之回归分析漫画顺序控制漫画线性代数漫画宇宙2-机器人竞技系列有视觉机器人制作机电一体化

2012-08-02 14:17:09

深入浅出学习机器学习

万万没想到，枯燥的“机器学习”还可以这样学！

2019-10-18 14:17:08

深度学习中过拟合/欠拟合的问题及解决方案

在进行数据挖掘或者机器学习模型建立的时候，因为在统计学习中，假设数据满足独立同分布（i.i.d，independently and identically distributed），即当前已产生

2021-01-28 06:57:47

电声测试系统有什么作用？

电声测试系统的可测量参数一般包括频率响应、灵敏度、极性、相位、Rub&Buzz、总谐波失真、阻抗、共振、响度、EBP、品质因数Qms、Qts、Re、F（频率/品质因数）和测试周围噪声等。此外，电声测试系统每次获得的测量数据都可以保存下来，作为后续处理或统计学分析的依据。

2019-11-04 09:00:40

集成学习和Boosting提升方法

李航《统计学习方法》——第八章Boosting提升方法【补充集成学习】+习题答案

2019-06-05 09:49:28

保证存储系统QoS的统计学访问控制算法

传统的访问控制算法采用有效带宽进行访问控制，效果并不理想。该文建立描述并发多媒体负载访问存储系统的排队论模型，提出基于统计学的存储系统访问控制算法。在保证多媒

2009-03-28 09:57:26

基于直方图统计学习的人脸检测方法

提出一种基于直方图统计学习的人脸检测方法，对人脸样本和非人脸样本进行小波变换，运用一组小波系数来表征各种人脸特征信息。统计每个训练样本的直方图分布，用于描述人

2009-04-15 08:45:44

概率论与数理统计学习资料

《概率论与数理统计》优秀学习资料,概率论与数理统计学习资料随机试验、样本空间与随机事件（1）随机试验：具有以下三个特点的试验称为随机试验，记为E.1）试验可

2010-02-13 11:40:22

[1.5.1]--5.机器学习和统计学习的关系

机器学习大数据

jf_60701476发布于 2022-12-05 11:26:11

机器学习和统计学习的关系(1)#大数据机器人

机器人

未来加油dz发布于 2023-07-10 21:21:48

机器学习和统计学习的关系(2)#大数据机器人

机器人

未来加油dz发布于 2023-07-10 21:22:11

C语言教程之使用数组统计学生成绩

C语言教程之使用数组统计学生成绩，很好的C语言资料，快来学习吧。

2016-04-25 15:13:54

Spark机器学习库的各种机器学习算法

本文将简要介绍Spark机器学习库（Spark MLlibs APIs）的各种机器学习算法，主要包括：统计算法、分类算法、聚类算法和协同过滤算法，以及各种算法的应用。你不是一个数据科学家。根据

2017-09-28 16:44:43

机器学习 vs 深度学习如何分清？

现在都在谈论人工智能或者大数据相关的知识，但是与之相关的机器学习、深度学习等你能分清吗？数据科学比机器学习范围大得多，数据科学实际上涵盖了整个数据处理的范围，而不只是算法或者统计学方面。

2017-12-18 16:28:50

779

一文读懂：机器学习、数据科学、人工智能、深度学习和统计学之间的区别

Scientists在工作中遇到数据相关时可以写出不错的代码，但是并不必须是专家，这类data scientist可能专业是实验设计、预测、建模、统计推断或者其他统计学研究的典型部分。

2018-02-12 03:55:00

3315

了解这些基本分析技术将为为项目的开发和数据的理解带来更多的益处

正如Josh Wills所言：“数据科学家比程序员擅长统计学，比统计学家擅长编程。” 很多软件工程师想转型数据科学家，但他们盲目地使用 TensorFlow 或 Apache Spark 等机器学习

2018-03-21 15:43:01

5183

细说机器学习的方法

机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

2018-05-18 23:44:00

2755

AI的定义及学术上的AI概念

当前大热机器学习技术是AI至关重要的子集，与模糊控制、知识表示与推理这类基于显式预置规则的技术不同，机器学习是基于统计学方法的，是利用统计学方法从已有的经验数据中获取规律并改进机器行为的AI技术。

2018-07-03 14:21:47

14161

机器学习心得总结

接触机器学习有一年了，是从上张敏老师的课开始的。后来师兄推荐了一本《统计学习理论的本质》，还记得第一印象觉得“统计”二字很奇怪。之后就渐渐习以为常了，接触到的机器学习方法都是基于统计的，以至于统计学习与机器学习成了一个概念，以至于最近看了一些东西突然觉得自己长见识了。

2018-07-07 09:40:00

12722

一文解读机器学习的作用及优势

当你打开互联网搜索引擎，输入关键词寻找并得到想要的链接时，“机器学习”已经贯穿整个过程：搜索到的内容是机器根据无数人搜索关键词的统计结果，返回的最可能被需要的目标信息；而同时，你的这一次搜索行为也已经被机器记录，加入到它的庞大无比的数据库中，用来了解人的搜索习惯和需求。

2018-07-07 09:09:00

12953

不同人眼里的机器学习是什么样的？

当一个人真正想在机器学习中取得一定成就时，他需要深入微积分、线性代数，掌握一定的统计学知识，研究的深度越深，数学基础的重要性就越显而易见。

2018-07-16 08:42:39

3078

如何使用统计学知识进行和统计分析误差分析？

3.1 误差分析背后的统计学知识

2018-08-22 01:32:00

4582

人工智能其实就是华丽的统计学？

人工智能其实就是统计学，只不过用了一个很华丽的辞藻，其实就是统计学。好多的公式都非常老，但是所有的人工智能利用的都是统计学来解决问题。

2018-08-13 15:33:25

2814

《统计学习方法》李航详细电子教材免费下载

详细介绍支持向量机、Boosting、最大熵、条件随机场等十个统计学习方法。

2018-08-22 17:55:15

机器学习算法工程师精选的算法面试这些知识你多了解吗？

通往机器学习算法工程师的进阶之路是崎岖险阻的。《线性代数》《统计学习方法》《机器学习》《模式识别》《深度学习》，以及《颈椎病康复指南》，这些书籍将长久地伴随着你的工作生涯。

2018-08-26 09:55:32

5829

机器学习教程之机器学习的核心算法和理论电子教材免费下载

从书本新闻。介绍性文本，介绍机器学习的主要方法和通过经验自动改进的计算机算法的研究。根据需要，引入统计学、人工智能、信息论和其他学科的基本概念，并均衡地覆盖理论和实践，并且提出它们的使用的主要算法

2018-10-23 14:18:03

机器学习入门教程之机器学习资料合集免费下载包括了资料和复习题

机器学习（Machine Learning， ML）是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

2018-11-15 15:35:35

什么叫机器学习

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

2018-11-20 17:19:59

20556

机器学习入门宝典《统计学习方法》的介绍

《统计学习方法》可以说是机器学习的入门宝典，许多机器学习培训班、互联网企业的面试、笔试题目，很多都参考这本书。本文根据网上资料用python复现了课程内容，并提供本书的代码实现、课件及电子书下载。

2018-11-25 09:24:13

4250

机器学习如何运作下一步是什么

今天的机器学习是以统计学为基础的，那么人工智能=统计学吗？

2019-01-17 10:36:23

3648

机器学习所需的数学知识你能够有效使用吗

开始机器学习之旅，需要什么层次的数学功底？尤其是对于那些没有学过数学和统计学的同学们来说，这个问题当前不甚清楚，在这篇文章中，我将要为那些使用机器学习技术来开发产品或做学术研究的人们提供一些数学背景方面的建议。

2019-02-02 17:10:00

1737

大学里好不容易听懂的统计学，会变成一件没“意义”的事情吗？

)。研究人员从较早的具有统计学意义的研究中发现，风险比同样为1.2。这项研究更加精确，其风险区间在9%到33%之间(P = 0.0003)。

2019-03-22 08:58:04

6993

统计学和机器学习的真正差别。你分得清吗？

这两种方法的目标不同，尽管使用的方法类似。机器学习算法的评估使用测试集来验证其准确性。统计模型可以使用置信区间，显着性检验和其他检验对回归参数进行分析，以评估模型的合法性。由于这些方法产生相同的结果，因此很容易理解为什么人们可能认为它们是相同的。

2019-04-08 08:55:00

8107

机器学习就是现代统计学

在5月 9日的北京智源人工智能研究院主办的“智源论坛——人工智能的数理基础”系列报告中，北京⼤学的张志华教授对机器学习和数学工程的内在关系进行了阐述。

2019-05-17 17:16:47

4177

人工智能学习路线六步走怎么走

很多机器学习的算法都是建立在概率论和统计学的基础上的，比如贝叶斯分类器、高斯隐马尔可夫链。

2019-07-08 09:38:51

10132

机器学习有哪一些算法

机器学习（Machine Learning， ML）是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2019-07-08 10:05:05

721

人工智能和机器学习有何不同

机器学习已经与统计学，数据挖掘和预测分析联系在一起，有些人认为它应该被归类为与人工智能分开的领域。

2019-07-16 09:13:00

970

对于机器学习的熟练度分析和介绍

如何借助机器学习的力量，使用数据做出更好的决策？MATLAB 让机器学习简单易行。借助用于处理大数据的工具和函数，以及让机器学习发挥作用的应用程序，MATLAB 是将机器学习应用于您的数据分析的理想环境。

2019-09-11 16:10:28

2138

人工智能只有统计学吗

人工智能并未朝着我们期望的方向发展，而是更多地走向了统计学的范畴。

2019-10-14 17:39:12

1042

机器学习对于物联网来说意味着什么

机器学习不仅仅是由企业或创新者所使用，它也用于安全目的，目前已有机器学习算法正在应对网络威胁。

2020-04-03 08:58:28

774

“机器学习”术语的诞生并不是为了区分统计学

麻省理工Sam Finlayson 博士指出“过去关于机器学习和统计学之间的讨论很大程度上没有切中要害，因为这些讨论要么忽略了历史背景、要么‘回归方法’归属模棱两可”，因此这种争论事实上毫无意义。

2020-04-15 16:27:46

7227

机器学习全面解析

机器学习是一门多领域交叉学科，涉及概率论、统计学、计算机科学等多门学科。机器学习的概念就是通过输入海量训练数据对模型进行训练，使模型掌握数据所蕴含的潜在规律，进而对新输入的数据进行准确的分类或预测

2020-04-15 17:39:53

4171

一文详谈机器学习

机器学习（Machine Learning）是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科，研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能，是人工智能技术的核心。

2020-07-01 09:28:21

1821

机器学习模型存在严重缺陷？

但是，使用AI辅助药物治疗真正的COVID-19患者的吸引力似乎还很遥远。世界各地的一组统计学家都对绝大多数机器学习模型的质量以及如果医院尽快采用它们可能造成的危害表示关注。

2020-07-22 15:25:42

2906

详解机器学习中的现状，算法，应用

机器学习是一门多领域交叉学科，廊括众多：涉及到概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

2020-07-28 09:04:19

2915

阐述机器学习如何与机器学习相互作用

知识图谱和机器学习，这两个看似不相关的事物，放在一起会发生什么样的化学反应？本文将从五个方面，阐述机器学习如何与机器学习相互作用，希望对你有帮助。

2020-07-28 09:10:36

782

机器学习的方法及应用领域

机器学习（machinelearning）是一门多领域交叉学科，涉及了概率论、统计学、算法复杂度等多门学科。

2020-08-24 17:33:12

7491

机器学习的范围和算法

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2020-11-12 10:19:12

1203

机器学习的范围/算法/分类

2021-01-21 09:29:06

3315

Jeff Ullman：机器学习不是数据科学的全部！统计学也不是

Ullman 是数据科学领域的巨擘，他的研究兴趣包括数据库理论、数据库集成、数据挖掘等。在去年撰写的一篇评论文章中，他用浅显的语言重新定义了，统计学、数据科学和机器学习之间的交叉点，并破除了其中的误读。他认为，尽管机器学习非常重要，但它远非实现有效数据科学所需的唯一工具。 01 Have we missed

2021-04-09 10:14:14

1482

浅析机器学习必学10大算法及8种降维技术

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身

2022-01-30 17:14:00

956

深度学习并非“简单的统计”

与此同时，Boaz Barak 通过展示拟合统计模型和学习数学这两个不同的场景案例，探讨其与深度学习的匹配性；他认为，虽然深度学习的数学和代码与拟合统计模型几乎相同，但在更深层次上，深度学习中的极大部分都可在“向学生传授技能”场景中被捕获。

2022-08-09 10:01:10

956

深度学习与经典统计学的差异

深度学习和简单的统计学是一回事吗？很多人可能都有这个疑问，毕竟二者连术语都有很多相似的地方。在这篇文章中，理论计算机科学家、哈佛大学知名教授 Boaz Barak 详细比较了深度学习与经典统计学的差异，认为“如果纯粹从统计学角度认识深度学习，就会忽略其成功的关键因素”。

2022-09-20 15:18:48

818

机器学习找一个好用的函数的原因是什么

（1）机器学习中经典的“支持向量机（SVM）”的主要提出者弗拉基米尔·万普尼克（Vladimir Vapnik），在其著作《统计学习理论的本质》中这样定义机器学习“机器学习就是一个基于经验数据的函数估计问题”。

2022-11-02 16:15:41

493

基于大数据将统计学方法在钙钛矿稳定性评估上的应用

综上所述，本工作提出了统一的钙钛矿太阳能电池稳定性描述指标，并基于大数据将统计学方法应用在钙钛矿稳定性评估上，对领域内的研究经验进行了验证，并进一步给出了准确量化的结论，对进一步探索钙钛矿太阳能电池稳定性提升策略具有重要参考意义。

2022-12-23 09:27:26

610

机器学习在物联网中发挥关键作用

2023-01-03 09:45:04

837

基于5个问题阐述GPU在增强AI和机器学习技术中的作用

基于5个问题阐述GPU在增强AI和机器学习技术中的作用。在21世纪初期，研究人员意识到，由于机器学习算法通常具有与图形处理算法相同类型的计算，因此GPU可以为机器学习提供基于CPU计算的更有

2023-01-30 10:42:18

737

机器学习的经典算法与应用

一、机器学习基础概念关于数据机器学习就是喂入算法和数据，让算法从数据中寻找一种相应的关系。 Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据

2023-05-28 11:29:41

652

聊一下机器学习和数据挖掘的关系

机器学习即 ML，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

2023-07-18 10:22:29

746

怎么学习人工智能

是一些学习人工智能的建议和技巧。 1. 学习数学和统计学 学习人工智能前，需要了解一些基础数学和统计学知识。这些知识对于算法、数据处理和机器学习有非常大的帮助，例如线性代数、微积分、概率和统计分析等。如果你没有这些基

2023-08-12 16:43:16

630

人工智能包括什么专业

数学和统计学是人工智能中不可或缺的学科。数学和统计学的相互作用使得人工智能能够进行高效的数据处理和模型预测。例如，机器学习算法中使用的线性代数、微积分和概率论工具等，都需要数学和统计学的基础知识。

2023-08-14 14:24:13

2529

机器学习的定义、分类及应用

机器学习（Machine Learning）是一种人工智能的技术，它是一种让计算机通过对大量数据进行分析和学习，从而可以自动进行预测和决策的技术。其核心思想是利用算法和统计学的方法来让计算机在没有人

2023-08-22 17:39:40

2281

机器学习的概念和发展历程机器学习的工作原理和基本组成

机器学习是人工智能的一个分支，它是一种让计算机通过大量的数据分析和学习，以便自主预测和决策的技术。它利用算法和统计学的方法，让计算机从数据中“学习”到模式，并使用这些模式来进行自主决策，在没有人

2023-08-22 17:40:54

806

统计学习方法代码集

统计学习所含部分代码合集

2023-09-07 09:24:21

已全部加载完成

搜索历史

统计学对于机器学习有什么作用

评论