机器学习算法：监督学习和强化学习

根据机器学习所需完成任务的性质，机器学习算法可分类为监督学习和强化学习。

一、监督学习

监督学习的具体案例包括：垃圾邮件识别、人脸识别等。

垃圾邮件识别需使计算机“学会”识别某个邮件是否为垃圾邮件。为实现计算机识别垃圾邮件，开发人员需搜集较多的垃圾邮件和非垃圾邮件，并“告诉”计算机各个邮件分属于垃圾邮件或非垃圾邮件。

人脸识别需使计算机“学会”通过人脸识别不同人，为实现计算机人脸识别，开发人员需搜集较多的人脸图片，并“告诉”计算机各个人脸图片分别代表哪个人。

上述的邮件和人脸图片可被称为训练数据，“告诉”计算机邮件和人脸图片的归类被称为打标签（Labeling for training data）。

为数据打标签需要较大的人力成本，例如：现代人脸识别系统需要数千万张带有标签的人脸图片，一般为数千万张人脸图片打标签需要数万小时的时间。因此，随着机器学习的发展，为数据打标签成为了一个独特的产业。

综上，监督学习（Supervised Learning）可定义为：同时向计算机输入训练数据和对应标签的机器学习。

二、强化学习

强化学习的具体案例包括：计算机下棋、自动驾驶等。

在计算机下棋、自动驾驶中，计算机不是通过输入训练数据和对应标签进行学习，而是通过计算机与环境互动学习。具体而言，计算机产生行为，同时获得这个行为的结果。所使用的机器学习算法需定义每个行为的收益函数（Reward function），以使计算机获得每个行为的结果（收益值），即计算机因行为获得奖励（收益值为正）或因行为受到惩罚（收益值为负）。

例如：在计算机下棋的算法中，计算机胜利获得奖励，计算机失败受到惩罚；在自动驾驶的算法中，顺利到达目的地，计算机获得奖励，中途出事故，计算机受到惩罚。

同时，强化学习的算法需设计相应的算法，使得计算机可以自动改变行为模式以将收益函数最大化。

综上，强化学习（Reinforcement Learning）可被定义为计算机通过与环境的互动逐渐强化其行为模式。

三、监督学习和强化学习可结合使用

监督学习和强化学习的应用不是完全分割的，在一个机器学习算法中可以同时使用机器学习和强化学习。例如：围棋机器学习算法AlphaGo（根据百度百科：该围棋算法与围棋世界冠军、职业九段棋手李世石进行围棋比赛，以4:1的总比分获胜；该算法在中国棋类网站与中日韩数十位围棋高手进行比赛，连续60局无败绩；该围棋算法与排名世界第一的世界围棋冠军柯洁对战，以3:0的总比分获胜。围棋界公认该算法的棋力已超过人类职业围棋顶尖水平）

不是单独使用强化学习建立机器学习算法，而是首先通过网络中围棋高手的对局进行监督学习获得了一个较好的初始围棋程序，再对该初始围棋程序进行强化学习。

编辑：黄飞

阅读全文

人脸识别(80468) 人脸识别(80468)
机器学习(130423) 机器学习(130423)
自动驾驶(162872) 自动驾驶(162872)
半监督学习(2473) 半监督学习(2473)

什么是深度强化学习?深度强化学习算法应用分析

什么是深度强化学习? 众所周知，人类擅长解决各种挑战性的问题，从低级的运动控制(如：步行、跑步、打网球)到高级的认知任务。

2023-07-01 10:29:50

1002

适用于任意数据模态的自监督学习数据增强技术

本文提出了一种适用于任意数据模态的自监督学习数据增强技术。自监督学习算法在自然语言处理、计算机视觉等领域取得了重大进展。这些自监督学习算法尽管在概念上是通用的，但是在具体操作上是基于特定的数据

2023-09-04 10:07:04

738

机器学习模型类型分类

机器学习按照模型类型分为监督学习模型、无监督学习模型两大类。 1. 有监督学习 有监督学习通常是利用带有专家标注的标签的训练数据，学习一个从输入变量X到输入变量Y的函数映射

2023-09-05 11:45:06

1161

什么是迁移学习？迁移学习的实现方法与工具分析

人工智能竞争，从算法模型的研发竞争，转向数据和数据质量的竞争，这些成功的模型和算法主要是由监督学习推动的，而监督学习对数据极度饥渴，需要海量数据（大数据）支撑来达到应用的精准要求。而人工智能发展更趋

2018-05-11 09:12:00

11650

机器学习工程师必知的10大算法

`转一篇好资料机器学习算法可以分为三大类：监督学习、无监督学习和强化学习。监督学习可用于一个特定的数据集（训练集）具有某一属性（标签），但是其他数据没有标签或者需要预测标签的情况。无监督学习可用

2017-04-18 18:28:36

【下载】《机器学习》+《机器学习实战》

、谋发展的决定性手段，这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。本书第一部分主要介绍机器学习基础，以及如何利用算法进行分类，并逐步介绍了多种经典的监督学习算法，如k近邻算法

2017-06-01 15:49:24

【阿里云大学免费精品课】机器学习入门：概念原理及常用算法

的性能。2.机器学习是对能通过经验自动改进的计算机算法的研究。3.机器学习是用数据或以往的经验，以此优化计算机程序的性能标准。机器学习算法可以分成下面几种类别：•监督学习：从给定的训练数据集中学习出一

2017-06-23 13:51:15

人工智能基本概念机器学习算法

目录人工智能基本概念机器学习算法1. 决策树2. KNN3. KMEANS4. SVM5. 线性回归深度学习算法1. BP2. GANs3. CNN4. LSTM应用人工智能基本概念数据集：训练集

2021-09-06 08:21:17

反向强化学习的思路

强化学习的另一种策略（二）

2019-04-03 12:10:44

如何用卷积神经网络方法去解决机器监督学习下面的分类问题？

人工智能下面有哪些机器学习分支？如何用卷积神经网络（CNN）方法去解决机器学习监督学习下面的分类问题？

2021-06-16 08:09:03

如何规划出完美的机器学习入门路径？| AI知识科普

的不同，机器学习可分为：监督学习，无监督学习，半监督学习，强化学习。在这里我们讲2种机器学习的常用方法：监督学习，无监督学习。监督学习是从标记的训练数据来推断一个功能的机器学习任务，可分为“回归”和“分类

2018-07-27 12:54:20

深度强化学习实战

内容2:课程一： TensoRFlow入门到熟练：课程二：图像分类：课程三：物体检测：课程四：人脸识别：课程五：算法实现：1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性生成

2021-01-10 13:42:26

深非监督学习-Hierarchical clustering 层次聚类python的实现

【深度学习基础-17】非监督学习-Hierarchical clustering 层次聚类-python实现

2020-04-28 10:07:39

经典算法大全（51个C语言算法+单片机常用算法+机器学十大算法）

无监督学习算法中，我们没有目标或结果变量来预测。通常用于不同群体的群体聚类。无监督学习的例子：Apriori 算法，K-means。0.3 强化学习 工作原理： 强化学习（reinforcement

2018-10-23 14:31:12

强化学习在RoboCup带球任务中的应用刘飞

强化学习在RoboCup带球任务中的应用_刘飞

2017-03-14 08:00:00

基于半监督学习的跌倒检测系统设计_李仲年

基于半监督学习的跌倒检测系统设计_李仲年

2017-03-19 19:11:45

机械工程师必学的几种算法

机器学习算法可以分为三个大类：监督学习、无监督学习、强化学习。监督学习对于有属性（标记）的特定数据集（训练集）是非常有效的。无监督学习对于在给定未标记的数据集（目标没有提前指定）上发现潜在关系是非

2017-09-20 11:15:33

谷歌带你体验一把什么是机器学习

机器学习的本质是模式识别。一部分可以用于预测（有监督学习，无监督学习），另一类直接用于决策（强化学习），机器学习的一个核心任务即模式识别，我们通常可以用模式识别来对我们未来研究的系统进行归类，并预测各种可能的未来结果。

2017-10-13 10:56:43

1626

深度强化学习是什么？有什么优点？

与监督机器学习不同，在强化学习中，研究人员通过让一个代理与环境交互来训练模型。当代理的行为产生期望的结果时，它得到正反馈。例如，代理人获得一个点数或赢得一场比赛的奖励。简单地说，研究人员加强了代理人的良好行为。

2018-07-13 09:33:00

24321

将深度学习和强化学习相结合的深度强化学习DRL

深度强化学习DRL自提出以来，已在理论和应用方面均取得了显著的成果。尤其是谷歌DeepMind团队基于深度强化学习DRL研发的AlphaGo，将深度强化学习DRL成推上新的热点和高度，成为人工智能历史上一个新的里程碑。因此，深度强化学习DRL非常值得研究。

2018-06-29 18:36:00

27596

萨顿科普了强化学习、深度强化学习，并谈到了这项技术的潜力和发展方向

萨顿在专访中（再次）科普了强化学习、深度强化学习，并谈到了这项技术的潜力，以及接下来的发展方向：预测学习

2017-12-27 09:07:15

10857

基于分层强化学习的多Agent路径规划

针对路径规划算法收敛速度慢及效率低的问题，提出了一种基于分层强化学习及人工势场的多Agent路径规划算法。首先，将多Agent的运行环境虚拟为一个人工势能场，根据先验知识确定每点的势能值，它代表最优

2017-12-27 14:32:02

基于LCS和LS-SVM的多机器人强化学习

本文提出了一种LCS和LS-SVM相结合的多机器人强化学习方法，LS-SVM获得的最优学习策略作为LCS的初始规则集。LCS通过与环境的交互，能更快发现指导多机器人强化学习的规则，为强化学习系统

2018-01-09 14:43:49

基于半监督学习框架的识别算法

问题，对半监督学习中的协同训练算法进行改进，提出了一种基于多学习器协同训练模型的人体行为识别方法．这是一种基于半监督学习框架的识别算法，该方法首先通过基于Q统计量的学习器差异性度量选择算法来挑取出协同训练中基学习

2018-01-21 10:41:09

如何深度强化学习人工智能和深度学习的进阶

传统上，强化学习在人工智能领域占据着一个合适的地位。但强化学习在过去几年已开始在很多人工智能计划中发挥更大的作用。

2018-03-03 14:16:56

3924

机器学习算法的无监督学习的详细介绍

and Unsupervised Learning 我们已经学习了许多机器学习算法，包括线性回归，Logistic回归，神经网络以及支持向量机。这些算法都有一个共同点，即给出的训练样本自身带有标记。比如

2018-05-01 17:43:00

12211

人工智能机器学习之强化学习

强化学习是智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大，强化学习不同于连接主义学习中的监督学习，主要表现在教师信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价

2018-05-30 06:53:00

1234

深度解析机器学习三类学习方法

在机器学习(Machine learning)领域。主要有三类不同的学习方法：监督学习(Supervised learning)、非监督学习(Unsupervised learning)、半监督学习(Semi-supervised learning)。

2018-05-07 09:09:01

13404

Python无监督学习的几种聚类算法包括K-Means聚类,分层聚类等详细概述

无监督学习是机器学习技术中的一类，用于发现数据中的模式。本文介绍用Python进行无监督学习的几种聚类算法，包括K-Means聚类、分层聚类、t-SNE聚类、DBSCAN聚类等。

2018-05-27 09:59:13

29728

Q Learning算法学习

Q Learning算法是由Watkins于1989年在其博士论文中提出，是强化学习发展的里程碑，也是目前应用最为广泛的强化学习算法。

2018-07-05 14:10:00

3368

强化学习在自动驾驶的应用

自动驾驶汽车首先是人工智能问题，而强化学习是机器学习的一个重要分支，是多学科多领域交叉的一个产物。今天人工智能头条给大家介绍强化学习在自动驾驶的一个应用案例，无需3D地图也无需规则，让汽车从零开始在二十分钟内学会自动驾驶。

2018-07-10 09:00:29

4676

什么是强化学习？纯强化学习有意义吗？强化学习有什么的致命缺陷？

强化学习是人工智能基本的子领域之一，在强化学习的框架中，智能体通过与环境互动，来学习采取何种动作能使其在给定环境中的长期奖励最大化，就像在上述的棋盘游戏寓言中，你通过与棋盘的互动来学习。

2018-07-15 10:56:37

17106

强化学习和监督式学习, 非监督式学习的区别

而这时，强化学习会在没有任何标签的情况下，通过先尝试做出一些行为得到一个结果，通过这个结果是对还是错的反馈，调整之前的行为，就这样不断的调整，算法能够学习到在什么样的情况下选择什么样的行为可以得到最好的结果。

2018-08-21 09:18:25

19123

总结机器学习小白必学的10种算法

在机器学习中，有一种叫做「没有免费的午餐」的定理。简而言之，它指出没有任何一种算法对所有问题都有效，在监督学习(即预测建模)中尤其如此。

2018-08-24 10:51:07

5514

基于目标图像的视觉强化学习算法，让机器人可以同时学习多个任务

强化学习是一种训练主体最大化奖励的学习机制，对于目标条件下的强化学习来说可以将奖励函数设为当前状态与目标状态之间距离的反比函数，那么最大化奖励就对应着最小化与目标函数的距离。

2018-09-24 10:11:00

6779

基于强化学习的MADDPG算法原理及实现

之前接触的强化学习算法都是单个智能体的强化学习算法，但是也有很多重要的应用场景牵涉到多个智能体之间的交互。

2018-11-02 16:18:15

21017

关于机器学习的超全总结

根据训练数据是否有标记，机器学习任务大致分为两大类：监督学习和非监督学习，监督学习主要包括分类和回归等，非监督学习主要包括聚类和频繁项集挖掘等。

2018-11-10 10:55:59

3765

利用机器学习来捕捉内部漏洞的工具运用无监督学习方法可发现入侵者

Darktrace新网络安全公司与剑桥大学的数学家合作，开发了一种利用机器学习来捕捉内部漏洞的工具。它运用无监督学习方法，查看大量未标记的数据，并找到不遵循典型模式的碎片。这些原始数据汇集到60多种不同的无监督学习算法中，它们相互竞争以发现异常行为。

2018-11-22 16:01:50

1099

你想要的机器学习课程笔记在这：主要讨论监督学习和无监督学习

with experience E（一个程序从经验E中学习解决任务T进行某一任务量度P，通过P测量在T的表现而提高经验E（另一种定义：机器学习是用数据或以往的经验，以此优化计算机程序的性能标准。）不同类型的机器学习算法：主要讨论监督学习和无监督学习 监督学习：利用一组已知类别的样本调整分类器的参数

2018-12-03 17:12:01

401

量化深度强化学习算法的泛化能力

OpenAI 近期发布了一个新的训练环境 CoinRun，它提供了一个度量智能体将其学习经验活学活用到新情况的能力指标，而且还可以解决一项长期存在于强化学习中的疑难问题——即使是广受赞誉的强化算法在训练过程中也总是没有运用监督学习的技术。

2019-01-01 09:22:00

2122

如何用Python进行无监督学习

无监督学习是一种用于在数据中查找模式的机器学习技术。无监督算法给出的数据不带标记，只给出输入变量(X)，没有相应的输出变量。在无监督学习中，算法自己去发现数据中有趣的结构。

2019-01-21 17:23:00

3915

聚焦 | 新技术“红”不过十年?半监督学习却成例外?

就目前来看，半监督学习是一个很有潜力的方向。

2019-06-18 17:24:14

2249

谷歌发布非政策强化学习算法OPC的最新研究机器学习即将开辟新篇章？

在谷歌最新的论文中，研究人员提出了“非政策强化学习”算法OPC，它是强化学习的一种变体，它能够评估哪种机器学习模型将产生最好的结果。数据显示，OPC比基线机器学习算法有着显著的提高，更加稳健可靠。

2019-06-22 11:17:08

3374

关于机器学习的一点

以机器学习中的监督学习为例，监督学习是从一组带有标记的数据中学习。

2019-07-04 15:31:49

303

最常见的机器学习面试问题及其相应的回答

在监督学习中，机器在标记数据的帮助下进行训练，即带有正确答案标记的数据。而在无监督机器学习中，模型自主发现信息进行学习。与监督学习模型相比，无监督模型更适合于执行困难的处理任务。

2019-09-20 15:01:30

2999

解析人工智能中深度学习的经典算法

深度学习作为机器学习的一个分支，其学习方法可以分为监督学习和无监督学习。

2020-01-30 09:29:00

2924

深度强化学习你知道是什么吗

强化学习非常适合实现自主决策，相比之下监督学习与无监督学习技术则无法独立完成此项工作。

2019-12-10 14:34:57

1092

懒惰强化学习算法在发电调控REG框架的应用

惰性是人类的天性，然而惰性能让人类无需过于复杂的练习就能学习某项技能，对于人工智能而言，是否可有基于惰性的快速学习的方法？本文提出一种懒惰强化学习(Lazy reinforcement learning, LRL) 算法。

2020-01-16 17:40:00

745

机器学习如何为云端的顶级服务

机器学习（ML）是人工智能（AI）的子集，它试图以几种不同的方式从数据集“学习”，其中包括监督学习和无监督学习。

2020-03-14 10:50:01

564

无监督机器学习如何保护金融

无监督机器学习是近年才发展起来的反欺诈手法。目前国内反欺诈金融服务主要是应用黑白名单、有监督学习和无监督机器学习的方法来实现。

2020-05-01 22:11:00

861

深度强化学习的概念和工作原理的详细资料说明

深度学习DL是机器学习中一种基于对数据进行表征学习的方法。深度学习DL有监督和非监督之分，都已经得到广泛的研究和应用。强化学习RL是通过对未知环境一边探索一边建立环境模型以及学习得到一个最优策略。强化学习是机器学习中一种快速、高效且不可替代的学习算法。

2020-05-16 09:20:40

3150

深度强化学习到底是什么？它的工作原理是怎么样的

2020-06-13 11:39:40

5529

机器学习算法中有监督和无监督学习的区别

无监督学习的好处之一是，它不需要监督学习必须经历的费力的数据标记过程。但是，要权衡的是，评估其性能的有效性也非常困难。相反，通过将监督学习算法的输出与测试数据的实际标签进行比较，可以很容易地衡量监督学习算法的准确性。

2020-07-07 10:18:36

5308

人工智能、机器学习以及深度学习三者之间的关系是什么？

来“训练”，通过各种算法从数据中学习如何完成任务。机器学习传统的算法包括决策树、聚类、贝叶斯分类等。从学习方法上来分可以分为监督学习、无监督学习、半监督学习、集成学习、深度学习和强化学习。

2020-07-26 11:14:44

10904

复杂应用中运用人工智能核心强化学习

近期，有不少报道强化学习算法在 GO、Dota 2 和 Starcraft 2 等一系列游戏中打败了专业玩家的新闻。强化学习是一种机器学习类型，能够在电子游戏、机器人、自动驾驶等复杂应用中运用人工智能。

2020-07-27 08:50:15

715

基于PPO强化学习算法的AI应用案例

Viet Nguyen就是其中一个。这位来自德国的程序员表示自己只玩到了第9个关卡。因此，他决定利用强化学习AI算法来帮他完成未通关的遗憾。

2020-07-29 09:30:16

2429

了解机器学习的十大算法

在机器学习领域，有种说法叫做“世上没有免费的午餐”，简而言之，它是指没有任何一种算法能在每个问题上都能有最好的效果，这个理论在监督学习方面体现得尤为重要。

2020-07-31 16:06:10

854

详谈机器学习及其三大分类

本节概述机器学习及其三个分类（监督学习、非监督学习和强化学习）。首先，与机器学习相关的术语有人工智能（Artificial Intelligence，AI）、机器学习（Machine Learning，ML）、强化学习、深度学习等，这里对这些术语进行简单的整理。

2020-08-14 12:24:47

23092

最基础的半监督学习

导读最基础的半监督学习的概念，给大家一个感性的认识。半监督学习(SSL)是一种机器学习技术，其中任务是从一个小的带标签的数据集和相对较大的未带标签的数据中学习得到的。SSL的目标是要比单独

2020-11-02 16:08:14

2344

半监督学习最基础的3个概念

有趣的方法，用来解决机器学习中缺少标签数据的问题。SSL利用未标记的数据和标记的数据集来学习任务。SSL的目标是得到比单独使用标记数据训练的监督学习模型更好的结果。这是关于半监督学习的系列文章的第2部分，详细介绍了一些基本的SSL技

2020-11-02 16:14:55

2651

一文详谈机器学习的强化学习

强化学习属于机器学习中的一个子集，它使代理能够理解在特定环境中执行特定操作的相应结果。目前，相当一部分机器人就在使用强化学习掌握种种新能力。

2020-11-06 15:33:49

1552

机器学习的基本过程及关键要素

机器学习的基本过程，罗列了几个主要流程和关键要素；继而展开介绍机器学习主要的算法框架，包括监督学习算法，无监督学习算法和常用的降维，特征选择算法等；最后在业务实践的过程中，给出了一个可行的项目管理流程，可供参考。

2020-11-12 10:28:48

10451

为什么半监督学习是机器学习的未来？

为什么半监督学习是机器学习的未来。 监督学习是人工智能领域的第一种学习类型。从它的概念开始，无数的算法，从简单的逻辑回归到大规模的神经网络，都已经被研究用来提高精确度和预测能力。然而，一个重大突破

2020-11-27 10:42:07

3610

半监督学习：比监督学习做的更好

监督学习是人工智能领域的第一种学习类型。从它的概念开始，无数的算法，从简单的逻辑回归到大规模的神经网络，都已经被研究用来提高精...

2020-12-08 23:32:54

1096

83篇文献、万字总结强化学习之路

深度强化学习是深度学习与强化学习相结合的产物，它集成了深度学习在视觉等感知问题上强大的理解能力，以及强化学习的决策能力，实现了...

2020-12-10 18:32:50

374

DeepMind发布强化学习库RLax

RLax（发音为“ relax”）是建立在JAX之上的库，它公开了用于实施强化学习智能体的有用构建块。。报道：深度强化学习实验室作者：DeepRL ...

2020-12-10 18:43:23

499

强化学习在智能对话上的应用介绍

本文主要介绍深度强化学习在任务型对话上的应用，两者的结合点主要是将深度强化学习应用于任务型对话的策略学习上来源：腾讯技术工程微信号

2020-12-10 19:02:45

781

机器学习中若干典型的目标函数构造方法

几乎所有的机器学习算法都归结为求解最优化问题。有监督学习算法在训练时通过优化一个目标函数而得到模型，然后用模型进行预测。无监督学习算法通常通过优化一个目标函数完成数据降维或聚类。强化学习算法在训练

2020-12-26 09:52:10

3816

深度学习：基于语境的文本分类弱监督学习

高成本的人工标签使得弱监督学习备受关注。seed-driven 是弱监督学习中的一种常见模型。该模型要求用户提供少量的seed words，根据seed words对未标记的训练数据生成伪标签，增加

2021-01-18 16:04:27

2657

机器学习的类型介绍

机器学习可以分为监督学习，半监督学习，非监督学习，强化学习，深度学习等。监督学习是先用带有标签的数据集合学习得到一个模型，然后再使用这个模型对新的标本进行预测。格物斯坦认为：带标签的数据进行特征提取

2021-03-12 16:01:27

2908

密度峰值聚类算法实现LGG的半监督学习

聚类算法，迭代地从数据集中筛选出多个中心点，以每个中心点为簇中心进行局部聚类，并以中心点为顶点构建图，实现基于LGC的半监督学习。实验结果表明，优化后的LGC方法在D31、 Aggregation等数据集上具有较好的鲁棒性，在标注正确率

2021-03-11 11:21:57

基于人工智能的自监督学习详解

自监督学习让 AI 系统能够从很少的数据中学习知识，这样才能识别和理解世界上更微妙、更不常见的表示形式。

2021-03-30 17:09:35

5596

机器学习中的无模型强化学习算法及研究综述

强化学习（ Reinforcement learning，RL）作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式，通过与环境进行交互来学习，最终将累积收益最大化。常用的强化学习算法分为

2021-04-08 11:41:58

模型化深度强化学习应用研究综述

深度强化学习（DRL）作为机器学习的重要分攴，在 Alphago击败人类后受到了广泛关注。DRL以种试错机制与环境进行交互，并通过最大化累积奖赏最终得到最优策略。强化学习可分为无模型强化学习和模型

2021-04-12 11:01:52

当机器人遇见强化学习，会碰出怎样的火花？

当机器人遇见强化学习，会碰出怎样的火花？一名叫 Cassie 的机器人，给出了生动演绎。最近，24 岁的中国南昌小伙李钟毓和其所在团队，用强化学习教 Cassie 走路，目前它已学会蹲伏走路

2021-04-13 09:35:09

2164

一种新型的多智能体深度强化学习算法

一种新型的多智能体深度强化学习算法

2021-06-23 10:42:47

《自动化学报》—多Agent深度强化学习综述

多Agent 深度强化学习综述来源：《自动化学报》，作者梁星星等摘要近年来,深度强化学习(Deep reinforcement learning,DRL) 在诸多复杂序贯决策问题中取得巨大

2022-01-18 10:08:01

1226

机器学习中的无监督学习应用在哪些领域

2022-01-20 10:52:10

4518

自监督学习的一些思考

自监督学习的流行是势在必然的。在各种主流有监督学习任务都做到很成熟之后，数据成了最重要的瓶颈。从无标注数据中学习有效信息一直是...

2022-01-26 18:50:17

融合零样本学习和小样本学习的弱监督学习方法综述

融合零样本学习和小样本学习的弱监督学习方法综述来源：《系统工程与电子技术》，作者潘崇煜等摘要: 深度学习模型严重依赖于大量人工标注的数据，使得其在数据缺乏的特殊领域内应用严重受限。面对数据缺乏

2022-02-09 11:22:37

1731

一种基于伪标签半监督学习的小样本调制识别算法

一种基于伪标签半监督学习的小样本调制识别算法来源：《西北工业大学学报》，作者史蕴豪等摘要：针对有标签样本较少条件下的通信信号调制识别问题，提出了一种基于伪标签半监督学习技术的小样本调制方式分类

2022-02-10 11:37:36

627

17个机器学习的常用算法！

源自：AI知识干货根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错

2022-08-22 09:57:33

1446

半监督学习代码库存在的问题与挑战

当使用监督学习(Supervised Learning)对大量高质量的标记数据(Labeled Data)进行训练时，神经网络模型会产生有竞争力的结果。例如，根据Paperswithcode网站统计

2022-10-18 16:28:03

939

强化学习的基础知识和6种基本算法解释

来源：DeepHub IMBA 强化学习的基础知识和概念简介（无模型、在线学习、离线强化学习等）机器学习(ML)分为三个分支:监督学习、无监督学习和强化学习。 监督学习(SL) ：关注在给

2022-12-20 14:00:02

828

7个流行的强化学习算法及代码实现

作者：Siddhartha Pramanik 来源：DeepHub IMBA 目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。这些算法

2023-02-03 20:15:06

747

机器学习算法的分类

根据有无标签，监督学习可分类为：传统的监督学习（Traditional Supervised Learning）、非监督学习（Unsupervised Learning）、半监督学习（Semi-supervised Learning）。

2023-04-18 16:26:13

630

彻底改变算法交易：强化学习的力量

强化学习（RL）是人工智能的一个子领域，专注于决策过程。与其他形式的机器学习相比，强化学习模型通过与环境交互并以奖励或惩罚的形式接收反馈来学习。

2023-06-09 09:23:23

355

每日一课 | 智慧灯杆人工智能之实践方法二：机器学习

3．机器学习谷歌CEO桑达尔·皮查伊在一封致股东信中，把机器学习誉为人工智能和计算的真正未来，可想而知机器学习在人工智能研究领域的重要地位。机器学习的方式包括有监督学习、无监督学习、半监督学习和强化学习

2022-03-22 09:50:11

470

强化学习的基础知识和6种基本算法解释

来源：DeepHubIMBA强化学习的基础知识和概念简介（无模型、在线学习、离线强化学习等）机器学习(ML)分为三个分支:监督学习、无监督学习和强化学习。监督学习(SL)：关注在给定标记训练数据

2023-01-05 14:54:05

419

7个流行的强化学习算法及代码实现

作者：SiddharthaPramanik来源：DeepHubIMBA目前流行的强化学习算法包括Q-learning、SARSA、DDPG、A2C、PPO、DQN和TRPO。这些算法已被用于在游戏

2023-02-06 15:06:38

665

基于强化学习的目标检测算法案例

摘要：基于强化学习的目标检测算法在检测过程中通常采用预定义搜索行为，其产生的候选区域形状和尺寸变化单一，导致目标检测精确度较低。为此，在基于深度强化学习的视觉目标检测算法基础上，提出联合回归与深度

2023-07-19 14:35:02

深度学习框架和深度学习算法教程

了基于神经网络的机器学习方法。深度学习算法可以分为两大类：监督学习和无监督学习。监督学习的基本任务是训练模型去学习输入数据的特征和其对应的标签，然后用于新数据的预测。而无监督学习通常用于聚类、降维和生成模型等任务中

2023-08-17 16:11:26

638

机器学习和深度学习的区别

的区别。 1. 机器学习机器学习是指通过数据使机器能够自动地学习和改进性能的算法。机器学习是人工智能的一个重要分支，它通过一系列的训练样本，让机器从数据中学习规律，从而得出预测或决策。机器学习算法可以分为有监督学习

2023-08-17 16:11:40

2734

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法汇总机器学习算法分类机器学习算法模型机器学习是人工智能的分支之一，它通过分析和识别数据模式，学习从中提取规律，并用于未来的决策和预测。在机器学习中，算法是最基本的组成部分之一。算法

2023-08-17 16:11:48

632

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器学习算法优缺点? 机器学习算法总结机器学习算法是一种能够从数据中自动学习的算法。它能够从训练数据中学习特征，进而对未知数据进行分类、回归、聚类等任务。通过

2023-08-17 16:11:50

939

机器学习算法入门机器学习算法介绍机器学习算法对比

机器学习算法入门机器学习算法介绍机器学习算法对比机器学习算法入门、介绍和对比随着机器学习的普及，越来越多的人想要了解和学习机器学习算法。在这篇文章中，我们将会简单介绍机器学习算法的基本概念

2023-08-17 16:27:15

569

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

有许多不同的类型和应用。根据机器学习的任务类型，可以将其分为几种不同的算法类型。本文将介绍机器学习的算法类型以及分类算法和预测算法。机器学习的算法类型 1. 监督学习算法在监督学习算法中，已知标记数据和相应的输出

2023-08-17 16:30:11

1245

深度学习的由来深度学习的经典算法有哪些

深度学习作为机器学习的一个分支，其学习方法可以分为监督学习和无监督学习。两种方法都具有其独特的学习模型：多层感知机、卷积神经网络等属于监 督学习；深度置信网、自动编码器、去噪自动编码器、稀疏编码等属于无监督学习。

2023-10-09 10:23:42

303

什么是强化学习

强化学习是机器学习的方式之一，它与监督学习、无监督学习并列，是三种机器学习训练方法之一。在围棋上击败世界第一李世石的 AlphaGo、在《星际争霸2》中以 10：1 击败了人类顶级职业玩家

2023-10-30 11:36:40

1051

已全部加载完成

搜索历史

机器学习算法：监督学习和强化学习

评论