机器学习算法的特征工程与意义详解

1、特征工程与意义

特征就是从数据中抽取出来的对结果预测有用的信息。

特征工程是使用专业知识背景知识和技巧处理数据，是得特征能在机器学习算法上发挥更好的作用的过程。

2、基本数据处理

数据采集

需要思考那些数据有用
数据是否容易采集到
线上实时计算的时候获取是否快捷

数据清洗

数据清洗做的事情：洗掉脏数据

思考角度：

1、单维度考量

身高3m的人？显然不可能

一个月买脸盆墩布花了10w的人？也不太可能

组合或统计属性判定

号称在美国但IP却一直在大陆的新闻阅读用户？

要统计一个人是否会去买篮球鞋，然而你的样本中女性占80%？

2、统计方法

使用箱线图/boxplot上下界

取出缺省值多的字段

不可信的样本要去掉，缺省值极多的字段考虑不用

数据采样

分类问题中，很多情况下正负样本是不均衡的。比如患某些疾病的患者和健康人。

大多数模型对正负样本比是敏感的（如逻辑回归LR）

解决方法：随机采样、分层采样
如果是正样本>>负样本，而且量都很大：在正样本下采样。（如正样本200万个，负样本20万个，此时在正样本中随机采样20万个，正负样本1:1构建分类器）
如果是正样本>>负样本，量不大：1、采集更多数据；2、可以oversampling，即过采样（如有10万正样本，1000负样本，最简单的方法是将1000负样本多重复几遍。然而这样做可能会加大过拟合风险，故会将负样本经过一些小的处理。如图像识别里面判断是否为猫，可将图片旋转？镜像处理？加上一些噪声？均可）；3、修改损失函数。

3、常见特征工程

数值型

1、幅度调整/归一化
- 幅度缩放Scaling
- 标准化Standardization
- 归一化Normalization

2、将数值进行Log等变化

3、统计值max、min、mean、std

4、离散化

对连续值可以将其离散化，按照一个区间来分（分箱、分桶）

下面代码生成满足标准高斯分布的20个随机数，使用pandas的cut函数可以将数据划分。

import numpy as np
import pandas as pd
arr = np.random.randn(20)
factor = pd.cut(arr,4)

factor
Out[5]: 
[(-0.643, 0.329], (0.329, 1.302], (-1.616, -0.643], (-1.616, -0.643], (-0.643, 0.329], ..., (-0.643, 0.329], (-0.643, 0.329], (-0.643, 0.329], (0.329, 1.302], (-1.616, -0.643]]
Length: 20
Categories (4, interval[float64]): [(-2.593, -1.616] < (-1.616, -0.643] < (-0.643, 0.329] < (0.329, 1.302]]

5、高次与四则运算特征

通过高次多项式或四则运算来将数据升维。

6、数值转为类别

类别型

1、one_hot编码/哑变量

原数据

做one_hot编码之后

注：不适合类别特别多的字段

2、Hash技巧

如上图，将文本型映射成向量

时间型

时间型数据既可以看成连续值，又可以看成离散值。

其他类型

1、文本型

词袋模型/bag of words

word2vec

文本数据预处理后，去掉停用词，剩下的词组成的list，在词库中的映射稀疏向量。

上述向量没有加上词的顺序，可以将词袋中的词扩充到n-gram。下图即为将“Bi-grams are cool！”这句话映射成1个单词和两个单词。

Tf-idf特征

Tf-idf是一种统计方法，用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随它在语料库中出现的频率成反比下降。

TF：Term Frequency

TF(t) = (词t在当前文中出现的次数)/(t在全部语料库中出现的次数)

IDF:

IDF(t)=ln(总文档数/含t的文档数)

TF-IDF权重 = TF(t)*IDF(t)

2、统计特征

加减平均

分位线

次序型

比例型

特征处理示例

4、特征选择方法

特征选择意义：

冗余：部分特征相关度太高了，消耗计算性能

噪声：部分特征是对预测结果有负影响

特征选择VS降维：

前者剔除原本特征里和结果预测关系不大的，后者做降维操作，但是保存大部分信息

SVD或PCA确实也能解决一定的高维问题

过滤式特征选择

评估单个特征和结果值之间的相关程度，排序留下Top相关的特征部分

Pearson系数，互信息，距离相关度

缺点：没有考虑到特征之间的关联作用，可能把有用的关联特征误剔除

分享一些最常见最实用的机器学习算法

在这篇文章中，分享一些最常用的机器学习算法。

2017-10-14 14:24:00

8793

一文详解机器学习和深度学习的区别

深度学习这几年特别火，就像5年前的大数据一样，不过深度学习其主要还是属于机器学习的范畴领域内，所以这篇文章里面我们来唠一唠机器学习和深度学习的算法流程区别。

2023-09-06 12:48:40

1181

机器学习工程师必知的10大算法

`转一篇好资料机器学习算法可以分为三大类：监督学习、无监督学习和强化学习。监督学习可用于一个特定的数据集（训练集）具有某一属性（标签），但是其他数据没有标签或者需要预测标签的情况。无监督学习可用

2017-04-18 18:28:36

机器学习算法分享

机器学习算法（1）——Logistic Regression

2020-06-09 13:30:03

机器学习算法如何用于制造无人驾驶汽车？

机器学习算法如何用于制造无人驾驶汽车

2021-03-18 06:27:18

机器学习——期望最大算法

机器学习 - 期望最大（EM）算法

2020-05-21 14:31:34

机器学习之 k-近邻算法(k-NN)

机器学习机器学习100天(5) --- k-近邻算法(k-NN)

2020-05-15 15:06:29

机器学习之高级算法课程学习总结

机器学习：高级算法课程学习总结

2020-05-05 17:17:16

机器学习的算法应用

关于机器学习的相关算法。正版资源，免费看的。

2017-08-24 22:14:36

机器学习简介与经典机器学习算法人才培养

上课时间安排：2022年05月27日 — 2022年05月30日No.1 第一天一、机器学习简介与经典机器学习算法介绍什么是机器学习？机器学习框架与基本组成机器学习的训练步骤机器学习问题的分类

2022-04-28 18:56:07

机器学习训练秘籍——吴恩达

机器学习的形式有许多种，但当前具备实用价值的大部分机器学习算法都来自于监督学习。我将经常提及神经网络（也被人们称为“深度学习” ），但你只需对这个概念有基础的了解便可以阅读本书后面的内容。如果对上

2018-11-30 16:45:03

机器算法学习比较

转本文主要回顾下几个常用算法的适应场景及其优缺点！机器学习算法太多了，分类、回归、聚类、推荐、图像识别领域等等，要想找到一个合适算法真的不容易，所以在实际应用中，我们一般都是采用启发式学习方式来实验

2016-09-27 10:48:01

机器视觉算法与应用（双语版）

与缩放的模板匹配3.11.5 可靠的模板匹配算法3.12 光学字符识别（OCR）3.12.1 字符分割3.12.2 特征提取3.12.3 字符分类4 机器视觉应用4.1 半导体晶片切割4.2 序列号读取

2016-06-29 13:48:38

机器人工程师学习计划

如何定义机器人？机器人工程师学习计划分享

2021-12-20 06:11:57

算法具有什么特征

一个算法应该具有以下五个重要的特征：1，有穷性（Finiteness）：算法的有穷性是指算法必须能在执行有限个步骤之后终止；2，确切性(Definiteness)：算法的每一步骤必须有确切的定义；3

2019-07-09 16:21:55

详解三电平传统SVPWM调制算法原理

各位同学你们好呀，上期我们讲了中性点钳位型的三电平逆变器原理，相信大家都有印象了。那么这一期我们要详解三电平传统SVPWM调制算法原理。通过学习后，希望能给初学者提供捷径明白算法原理，将来做仿真

2021-08-27 07:25:20

Adaboost算法的Haar特征怎么进行并行处理？

Adaboost 算法是Freund 和Schapire 于1995 年提出的，全称为Adaptive Boosting。它是 Boosting 算法的改进，意为该算法通过机器训练与学习不断自适应地调整假设的错误率，这种灵活性使得Adaboost 算法很容易与实际应用联系起来。

2019-08-28 07:05:11

Python机器学习常用库

欢迎的编程语言！人工智能是当前最热门话题之一，机器学习技术是人工智能实现必备技能，Python编程语言含有最有用的机器学习工具和库，以下是Python开发工程师必知的十大机器学习库！一

2018-03-26 16:29:41

【下载】《机器学习》+《机器学习实战》

、谋发展的决定性手段，这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。本书第一部分主要介绍机器学习基础，以及如何利用算法进行分类，并逐步介绍了多种经典的监督学习算法，如k近邻算法

2017-06-01 15:49:24

【阿里云大学免费精品课】机器学习入门：概念原理及常用算法

摘要：阿里云大学联合蚂蚁金服高级算法专家推出了免费的机器学习入门课程：机器学习入门：概念原理及常用算法（点击开始学习） AlaphaGo与围棋界的较量，吸引了全世界的目光，也让大家见识到了机器

2017-06-23 13:51:15

人工智能和机器学习的前世今生

，并将人类决策过程编码成算法。这些算法可以被应用到几个实例以得出有意义的结论。在这篇文章中，我们将了解一些机器学习的基础、工作原理及特点。举例来了解机器学习经研究预测，截至到2020年，企业采用机器学习

2018-08-27 10:16:55

人工智能基本概念机器学习算法

目录人工智能基本概念机器学习算法1. 决策树2. KNN3. KMEANS4. SVM5. 线性回归深度学习算法1. BP2. GANs3. CNN4. LSTM应用人工智能基本概念数据集：训练集

2021-09-06 08:21:17

什么是机器学习? 机器学习基础入门

的、面向任务的智能，这就是机器学习的范畴。我过去听到的机器学习定义的最强大的方法之一是与传统的、用于经典计算机编程的算法方法相比较。在经典计算中，工程师向计算机提供输入数据ーー例如，数字2和4ーー以及将它

2022-06-21 11:06:37

常用python机器学习库盘点

现在人工智能非常火爆，机器学习应该算是人工智能里面的一个子领域，而其中有一块是对文本进行分析，对数据进行深入的挖掘提取一些特征值，然后用一些算法去学习,训练,分析,甚至还能预测，那么Python中常

2018-05-10 15:20:21

干货 | 这些机器学习算法，你了解几个？

现地非常出色，可以轻松地使用成批量的传播方法来更新数据。它的体系结构（即层的数量和结构）可以适应许多类型的问题，并且它们的隐藏层减少了对特征工程的需要。缺点：深度学习算法不适合作为通用算法，因为它们

2019-09-22 08:30:00

有没有搞机器学习算法研究的啊？

有没有搞机器学习、人工智能相关的算法研究的啊？自己一个人搞感觉挺难的，希望找到志同道合的朋友，相互探讨。

2016-02-26 09:56:00

经典算法大全（51个C语言算法+单片机常用算法+机器学十大算法）

试题学SPFA算法整体来说，机器学习算法可以分为 3 大类：0.1 监督学习工作原理：该算法由自变量（协变量、预测变量）和因变量（结果变量）组成，由一组自变量对因变量进行预测。通过这些变量集合，我们

2018-10-23 14:31:12

请问谁做过蚁群算法选择图像特征，使识别准确率最高？

请问谁做过蚁群算法选择图像特征，使识别准确率最高？有学习资料或者matlab代码可以让我学习一下吗

2019-02-17 17:20:32

阿里深度学习的“金刚钻”——千亿特征XNN算法及其落地实践

博士，2016年加入阿里巴巴，现主要从事推荐系统特征、模型、架构和大规模机器学习框架的研发工作。以下内容根据演讲嘉宾视频分享以及PPT整理而成。本次分享的主要围绕以下三个方面：一．业务背景二．XPS机器学习

2018-04-24 16:43:39

高级机器学习算法工程师--【北京】

职位描述：1. 负责计算机视觉&机器学习（包括深度学习）算法的开发与性能提升，负责下述研究课题中的一项或多项，包括但不限于：人脸识别、检测、活体、跟踪、分类、语义分割、深度估计、图像处理

2017-12-07 14:34:41

一文详解机器学习工程师必知的10大算法

Netflix的算法可以根据你以前看过的电影来进行电影推荐，而Amazon的算法则可以根据你以前买过的书来推荐书籍。所以如果你想了解更多有关机器学习的内容，那么你该如何入门？

2018-07-08 11:05:00

1536

一文解析机器学习常用35大算法

本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然，本文收录的算法并不完全，分类的方式也不唯一。

2018-06-30 04:24:00

3645

机器学习经典算法-最优化方法

机器学习算法之最优化方法

2017-09-04 10:05:10

Spark机器学习库的各种机器学习算法

本文将简要介绍Spark机器学习库（Spark MLlibs APIs）的各种机器学习算法，主要包括：统计算法、分类算法、聚类算法和协同过滤算法，以及各种算法的应用。你不是一个数据科学家。根据

2017-09-28 16:44:43

R语言机器学习算法的性能分析比较

你如何有效地计算出不同机器学习算法的估计准确性？在这篇文章中，你将会学到8种技术，用来比较R语言机器学习算法。你可以使用这些技术来选择最精准的模型，并能够给出统计意义方面的评价，以及相比其它算法

2017-10-12 16:33:39

机器学习特征选择常用算法

) ，是指从全部特征中选取一个特征子集，使构造出来的模型更好。在机器学习的实际应用中，特征数量往往较多，其中可能存在不相关的特征，特征之间也可能存在相互依赖，容易导致如下的后果：特征个数越多，分析特征、训练模型所需的时间就越长。

2017-11-16 01:28:15

8107

机器学习分类算法中必须要懂的四种算法

本文主要介绍了4 种应用比较普遍的的机器学习算法，但是机器学习算法还有其他很多不同的算法，大家感兴趣的可以自己去了解。朴素贝叶斯分类是基于贝叶斯定理与特征条件独立假设的分类方法，发源于古典数学理论，拥有稳定的数学基础和分类效率。

2017-12-26 14:45:02

26224

机器学习算法分类

机器学习起源于人工智能，可以赋予计算机以传统编程所无法实现的能力，比如飞行器的自动驾驶、人脸识别、计算机视觉和数据挖掘等。机器学习的算法很多。很多时候困惑人们的是，很多算法是一类算法，而有些算法又是

2018-01-05 17:36:10

3101

基于排序学习的推荐算法

排序学习技术尝试用机器学习的方法解决排序问题，已被深入研究并广泛应用于不同的领域，如信息检索、文本挖掘、个性化推荐、生物医学等．将排序学习融入推荐算法中，研究如何整合大量用户和物品的特征，构建更加

2018-01-16 15:50:35

人工智能之机器学习常见算法

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里小编为您总结一下常见的机器学习算法，以供您在工作和学习中参考。

2018-02-02 17:20:46

1552

机器学习新手最适合学习的10个算法

算法永远是一段代码的灵魂，面对海量的机器学习算法，萌新最爱问的是，“我该选什么算法？”

2018-03-29 14:10:39

7887

人工智能机器学习之K近邻算法（KNN）

K近邻KNN（k－Nearest Neighbor）算法，也叫K最近邻算法，1968年由 Cover 和 Hart 提出，是机器学习算法中比较成熟的算法之一。K近邻算法使用的模型实际上对应于对特征空间的划分。KNN算法不仅可以用于分类，还可以用于回归。

2018-05-29 06:53:00

2416

机器学习中的特征选择的5点详细资料概述

特征选择是一个重要的“数据预处理” (data preprocessing) 过程，在现实机器学习任务中，获得数据之后通常先进行特征选择，此后再训练学习器。那么，为什么要进行特征选择呢？

2018-06-18 17:24:00

6686

机器学习的意义(ppt 20页)

机器学习的意义(ppt 20页)下载信息页，所属分类：信息化综合知识，关键词：管理信息化,信息技术，更新时间：2008/2/13 9:29:56。如果该资料是您需要的，请点击下赞助本站 1. 学习

2018-06-27 18:55:02

684

在工程师的手中，我们可以用机器学习搭建自己的音乐梦想！

万万没想到，在工程师的手中，我们可以用机器学习搭建自己的音以决策树为例，这是一种常见的机器学习算法，并不涉及“神经网络”、“深度学习”的范畴。简言之，决策树是一种以递归方式学习每个特征的阈值并将数据分类的系统。

2018-08-01 09:41:43

2689

经典的机器学习算法汇总

本文将用一句话来总结每种典型的机器学习算法，帮你抓住问题的本质，强化理解和记忆。

2018-08-11 10:24:15

5500

机器学习算法工程师精选的算法面试这些知识你多了解吗？

通往机器学习算法工程师的进阶之路是崎岖险阻的。《线性代数》《统计学习方法》《机器学习》《模式识别》《深度学习》，以及《颈椎病康复指南》，这些书籍将长久地伴随着你的工作生涯。

2018-08-26 09:55:32

5829

想掌握机器学习技术？从了解特征工程开始

问题。解决这些问题的方法与数据预处理的方法在机器学习中被统称为特征工程，今天我们就来了解一下吧。 ◆ ◆ ◆特征工程是什么当你想要你的预测模型性能达到最佳时，你要做的不仅是要选取最好的算法，还要

2018-12-05 09:36:16

1966

机器学习算法常用指标汇总

机器学习性能评价标准是模型优化的前提，在设计机器学习算法过程中，不同的问题需要用到不同的评价标准，本文对机器学习算法常用指标进行了总结。

2019-02-13 15:09:19

3945

机器学习算法工程师的基本素质有哪些

本来这篇标题我想的是算法工程师的技能，但是我觉得要是加上机器学习在标题上，估计点的人会多一点，所以标题成这样了，呵呵，而且被搜索引擎收录的时候多了一个时下的热门词，估计曝光也会更多点。不过放心，文章没有偏题，我们来说正经的。

2019-04-22 16:12:48

1988

机器学习十大算法精髓总结

最常见的机器学习算法是学习映射Y = f(X)来预测新X的Y，这叫做预测建模或预测分析。

2019-05-05 09:21:00

3474

机器学习处理器怎样选择合适的

虽然经典机器学习算法需要人工干预来从数据中提取特征，但机器学习算法或网络模型学习如何提取数据中的重要特征并对该数据进行智能预测。

2019-09-11 11:52:15

2260

详解机器学习分类算法KNN

本文主要介绍一个被广泛使用的机器学习分类算法，K-nearest neighbors（KNN），中文叫K近邻算法。

2019-10-31 17:18:14

5657

机器学习特征工程的五个方面优点

特征工程是用数学转换的方法将原始输入数据转换为用于机器学习模型的新特征。特征工程提高了机器学习模型的准确度和计算效率，体现在以下五个方面

2020-03-15 16:57:00

3564

人人都能懂的机器学习算法原理教程免费下载

算法公式挺费神，机器学习太伤人。任何一个刚入门机器学习的人都会被复杂的公式和晦涩难懂的术语吓到。但其实，如果有通俗易懂的图解，理解机器学习的原理就会非常容易。本文整理了一篇博客文章的内容，读者可根据这些图理解看似高深的机器学习算法。

2020-05-21 08:00:00

详解机器学习中的现状，算法，应用

机器学习是一门多领域交叉学科，廊括众多：涉及到概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

2020-07-28 09:04:19

2915

理解机器学习中的算法与模型

对于初学者来说，这很容易让人混淆，因为“机器学习算法”经常与“机器学习模型”交替使用。这两个到底是一样的东西呢，还是不一样的东西？作为开发人员，你对排序算法、搜索算法等“算法”的直觉，将有助于你厘清这个困惑。在本文中，我将阐述机器学习“算法”和“模型”之间的区别。

2020-07-31 15:38:08

3347

机器学习之特征提取 VS 特征选择

机器学习中特征选择和特征提取区别 demi 在周四, 06/11/2020 - 16:08 提交 1. 特征提取 V.S 特征选择特征提取和特征选择

2020-09-14 16:23:20

3735

机器学习算法使用机器来了解给定的数据集

机器学习一词经常与AI互换使用，尽管有明显的区别。机器学习算法使用机器来了解给定的数据集。机器学习的一个子集包括深度学习，它在网络安全领域显示出了巨大的希望

2020-09-16 17:05:24

1980

机器学习的范围和算法

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2020-11-12 10:19:12

1203

机器学习的基本过程及关键要素

机器学习的基本过程，罗列了几个主要流程和关键要素；继而展开介绍机器学习主要的算法框架，包括监督学习算法，无监督学习算法和常用的降维，特征选择算法等；最后在业务实践的过程中，给出了一个可行的项目管理流程，可供参考。

2020-11-12 10:28:48

10451

机器学习算法工程师必读经典畅销书推荐

【导读】今天给大家推荐一本机器学习算法工程师必读经典畅销书！它就是美团机器学习实践，该书系统阐述了美团算法工程师的完整工作流程，结合真实场景实践教学。美团算法团队由数百名优秀算法工程师组成

2020-12-26 09:38:23

2619

机器学习的范围/算法/分类

什么是机器学习？机器学习是英文名称MachineLearning（简称ML）的直译。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

2021-01-21 09:29:06

3315

机器学习的类型介绍

提取，再生成特征向量，通过机器学习的算法，得到模型。当小朋友遇到一只小狗，老师告诉他这是一只小狗，小朋友下次见到小狗就自然认识了。这个过程就是监督学习。在AI这块领域，未来最缺的一是工程能力强的算法人才，过去两

2021-03-12 16:01:27

2908

最实用的的五种机器学习算法

最实用的机器学习算法Top5 demi 在周一, 04/01/2019 - 10:35 提交本文将推荐五种机器学习算法，你应该考虑是否将它们投入应用。这五种算法覆盖最常用于聚类、分类、数值预测

2021-03-24 16:14:31

5987

基于机器学习算法的水文趋势预测方法

针对传统的利用神经网络等工具进行水文趋势预测得出结果不具备解释性等不足，文中提出一种基于机器学习算法的水文趋势预测方法，该方法旨在利用 XGBOOST机器学习算法建立参照期与水文预见期之间各水文特征

2021-04-26 15:39:30

详谈机器学习模型算法的质量保障方案

近年来，机器学习模型算法在越来越多的工业实践中落地。在滴滴，大量线上策略由常规算法迁移到机器学习模型算法。如何搭建机器学习模型算法的质量保障体系成为质量团队急需解决的问题之一。本文整体介绍了机器学习模型算法的质量保障方案，并进一步给出了滴滴质量团队在机器学习模型效果评测方面的部分探索实践。

2021-05-05 17:08:00

2010

机器学习可靠性与算法优化

机器学习可靠性与算法优化教材免费下载。

2021-05-19 09:39:29

特征选择和机器学习的软件缺陷跟踪系统对比

针对Bugzilla缺陷跟踪系统的ε clipse项目软件缺陷报告数据集，使用特征选择和机器学习算法对向量化的原始数据进行特征降维、权重优化等处理，得到数据维度较低的优化数据集，并采用分类算法评估

2021-06-10 10:50:56

基于机器学习的哈希检索算法综述

2021-06-10 11:05:56

基于WordNet模型的迁移学习文本特征对齐算法

2021-06-27 16:14:43

机器学习和深度学习算法流程

但是无可否认的是深度学习实在太好用啦！极大地简化了传统机器学习的整体算法分析和学习流程，更重要的是在一些通用的领域任务刷新了传统机器学习算法达不到的精度和准确率。

2022-04-26 15:07:20

4084

17个机器学习的常用算法

根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法，这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。

2022-08-11 11:20:17

1399

17个机器学习的常用算法！

源自：AI知识干货根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错

2022-08-22 09:57:33

1446

机器学习算法的基础介绍

现在，机器学习有很多算法。如此多的算法，可能对于初学者来说，是相当不堪重负的。今天，我们将简要介绍 10 种最流行的机器学习算法，这样你就可以适应这个激动人心的机器学习世界了！

2022-10-24 10:08:42

1518

深度学习算法如何工作?排名前十的深度学习算法介绍

定义神经网络 Neural Networks，简称NN。针对机器学习算法需要领域专家进行特征工程，模型泛化性能差的问题，提出了NN可以从数据的原始特征学习特征表示，无需进行复杂的特征处理。

2022-11-03 10:46:35

961

常用机器学习算法的基本概念和特点

没有哪一种算法能够适用所有情况，只有针对某一种问题更有用的算法。机器学习算法不会要求一个问题被 100%求解，取而代之的是把问题转化为最优化的问题，用不同的算法优化问题，从而比较得到尽量好的结果

2023-01-17 15:43:09

2979

机器学习算法的随机数据生成简析

在学习机器学习算法的过程中，我们经常需要数据来验证算法，调试参数。

2023-03-15 09:07:48

360

机器学习算法学习之特征工程1

特征工程是机器学习过程中的关键步骤，涉及将原始数据转换为机器学习算法可以有效使用的格式。在本篇博客文章中，我们介绍了各种特征工程技术，包括特征选择和提取、编码分类变量、缩放和归一化、创建新特征、处理不平衡数据、处理偏斜和峰度、处理稀有类别、处理时间序列数据、特征转换和文本预处理。

2023-04-19 11:38:43

519

机器学习算法学习之特征工程2

2023-04-19 11:38:47

560

机器学习算法学习之特征工程3

2023-04-19 11:38:51

703

机器学习的经典算法与应用

一、机器学习基础概念关于数据机器学习就是喂入算法和数据，让算法从数据中寻找一种相应的关系。 Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据

2023-05-28 11:29:41

652

机器学习理论：k近邻算法

KNN(k-Nearest Neighbors)思想简单，应用的数学知识几乎为0，所以作为机器学习的入门非常实用、可以解释机器学习算法使用过程中的很多细节问题。能够更加完整地刻画机器学习应用的流程。

2023-06-06 11:15:02

392

基于机器学习算法的校准优化方案

2023-06-29 12:35:49

236

智能数字辨识水表-基于机器学习算法

智智能数字辨识水表-基于机器学习算法

2023-08-10 11:26:40

371

深度学习算法简介深度学习算法是什么深度学习算法有哪些

深度学习算法简介深度学习算法是什么?深度学习算法有哪些? 作为一种现代化、前沿化的技术，深度学习已经在很多领域得到了广泛的应用，其能够不断地从数据中提取最基本的特征，从而对大量的信息进行机器学习

2023-08-17 16:02:56

6010

深度学习算法工程师是做什么

深度学习算法工程师是做什么深度学习算法工程师是一种高级技术人才，是数据科学中创新的推动者，也是实现人工智能应用的重要人才。他们致力于开发和实现深度机器学习算法来解决各种现实问题，应用于各个领域

2023-08-17 16:03:01

725

深度学习框架和深度学习算法教程

了基于神经网络的机器学习方法。深度学习算法可以分为两大类：监督学习和无监督学习。监督学习的基本任务是训练模型去学习输入数据的特征和其对应的标签，然后用于新数据的预测。而无监督学习通常用于聚类、降维和生成模型等任务中

2023-08-17 16:11:26

638

机器学习算法的5种基本算子

机器学习算法的5种基本算子机器学习是一种重要的人工智能技术，它是为了让计算机能够通过数据自主的学习和提升能力而发明的。机器学习算法是机器学习的核心，它是指让计算机从数据中进行自主学习并且可以实现

2023-08-17 16:11:46

1245

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法汇总机器学习算法分类机器学习算法模型机器学习是人工智能的分支之一，它通过分析和识别数据模式，学习从中提取规律，并用于未来的决策和预测。在机器学习中，算法是最基本的组成部分之一。算法

2023-08-17 16:11:48

632

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器学习算法优缺点? 机器学习算法总结机器学习算法是一种能够从数据中自动学习的算法。它能够从训练数据中学习特征，进而对未知数据进行分类、回归、聚类等任务。通过

2023-08-17 16:11:50

939

机器学习算法入门机器学习算法介绍机器学习算法对比

机器学习算法入门机器学习算法介绍机器学习算法对比机器学习算法入门、介绍和对比随着机器学习的普及，越来越多的人想要了解和学习机器学习算法。在这篇文章中，我们将会简单介绍机器学习算法的基本概念

2023-08-17 16:27:15

569

机器学习vsm算法

机器学习vsm算法随着机器学习技术的不断发展，相似性计算是机器学习中的重要组成部分。在信息检索、文本挖掘、机器翻译等领域中，相似性计算是必不可少的一项技术。在这些领域中，我们通常使用向量空间模型

2023-08-17 16:29:35

529

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？机器学习是一种人工智能技术，通过对数据的分析和学习，为计算机提供智能决策。机器学习算法是实现机器学习的基础。常见的机器学习算法

2023-08-17 16:30:11

1245

瑞萨电子深度学习算法在缺陷检测领域的应用

浪费大量的人力成本。因此，越来越多的工程师开始将深度学习算法引入缺陷检测领域，因为深度学习在特征提取和定位方面取得了非常好的效果。

2023-09-22 12:19:00

449

什么是特征工程？机器学习的特征工程详解解读

One-hot 编码对于用机器学习模型能够理解的简单数字数据替换分类数据很有用。

2023-12-28 17:14:15

128

已全部加载完成

搜索历史

机器学习算法的特征工程与意义详解

1、特征工程与意义

2、基本数据处理

3、常见特征工程

评论