使用多层感知器进行机器学习-电子发烧友网

到目前为止，我们关注的是单层感知器，它由一个输入层和一个输出层组成。您可能还记得，我们使用术语“单层”是因为此配置仅包括一层计算活动节点，即通过求和然后应用激活函数来修改数据的节点。输入层中的节点只是分发数据。

单层感知器在概念上很简单，训练过程非常简单。不幸的是，它不提供我们复杂的、现实生活中的应用程序所需的功能。我的印象是，解释单层感知器的基本限制的标准方法是使用布尔运算作为说明性示例，这就是我将在本文中采用的方法。

我们将使用一个极其复杂的微处理器来实现一个神经网络，该神经网络可以完成与由少数晶体管组成的电路相同的事情，这个想法有些幽默。但与此同时，以这种方式思考这个问题强调了单层感知器作为一般分类和函数逼近工具的不足——如果我们的感知器不能复制单个逻辑门的行为，我们知道我们需要找到一个更好的感知器。

让我们回到本系列篇文章中介绍的系统配置。

这个感知器的一般形状让我想起了一个逻辑门，事实上，它很快就会变成这样。假设我们使用包含输入向量元素的 0 和 1 的样本来训练该网络，并且仅当两个输入都等于 1 时输出值才等于 1。结果将是一个神经网络，它以类似于与门的电气行为的方式对输入向量进行分类。

该网络输入的维数为 2，因此我们可以轻松地将输入样本绘制成二维图形。假设 input0 对应于水平轴，input1 对应于垂直轴。四种可能的输入组合将排列如下：

由于我们正在复制 AND 操作，因此网络需要修改其权重，使输入向量［1，1］的输出为 1，其他三个输入向量的输出为 0。基于这些信息，让我们将输入空间划分为对应于所需输出分类的部分：

线性可分数据

如上图所示，当我们实现 AND 运算时，可以通过绘制一条直线对绘制的输入向量进行分类。线一侧的所有内容接收到的输出值为 1，而另一侧的所有内容接收到的输出值为零。因此，在 AND 运算的情况下，呈现给网络的数据是线性可分的。OR 操作也是如此：

事实证明，单层感知器只有在数据线性可分的情况下才能解决问题。无论输入样本的维数如何，都是如此。二维情况很容易可视化，因为我们可以绘制点并用一条线将它们分开。为了概括线性可分性的概念，我们必须使用“超平面”这个词而不是“线”。超平面是在n维空间中可以分离数据的几何特征。在二维环境中，超平面是一维特征（即一条线）。在三维环境中，超平面是一个普通的二维平面。在n维环境中，超平面具有（ n -1）维。

解决不可线性分离的问题

在训练过程中，单层感知器使用训练样本来确定分类超平面的位置。在找到能够可靠地将数据分成正确的分类类别的超平面后，它就可以采取行动了。然而，如果超平面不存在，感知器将不会找到它。让我们看一个不可线性分离的输入到输出关系的例子：

你承认这种关系吗？再看一看，无非是异或运算。您不能用直线分隔 XOR 数据。因此，单层感知器无法实现异或门提供的功能，如果它无法执行异或运算，我们可以放心地假设许多其他（更有趣的）应用程序将超出问题的范围 -解决单层感知器的能力。

幸运的是，我们可以通过简单地增加一层额外的节点来大大提高神经网络解决问题的能力。这将单层感知器变成了多层感知器（MLP）。正如上一篇文章所提到的，这一层之所以被称为“隐藏”，是因为它与外界没有直接的接口。我想您可以将 MLP 视为众所周知的“黑匣子”，它接受输入数据、执行神秘的数学运算并生成输出数据。隐藏层在那个黑盒子里面。你看不到它，但它就在那里。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4771

浏览量
100718
微处理器

微处理器

+关注

关注
11

文章
2258

浏览量
82405
晶体管

晶体管

+关注

关注
77

文章
9682

浏览量
138082

深度学习与数据挖掘的关系

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征

发表于 07-04 16:07

DL：DL单层感知器Perceptron的原理及Perceptron Can not solve XOR problem

DL：DL单层感知器Perceptron的原理及PerceptronCan not solveXOR problem

发表于 12-21 10:35

如何使用Keras框架搭建一个小型的神经网络多层感知器

本文介绍了如何使用Keras框架，搭建一个小型的神经网络-多层感知器，并通过给定数据进行计算训练，最好将训练得到的模型提取出参数，放在51单片机上进行运行。

发表于 11-22 07:00

多层感知器在提高软件可维护性上的应用

预测分析软件质量可看作是一个以源代码度量作为属性标签、模块性能作为类标签的分类问题。首次提出将多层感知器应用于软件质量预测，并使用对称不定性分析来提高其分类性能。

发表于 04-06 00:01 •20次下载

对多层感知器和反向传播进行入门级的介绍

本文对多层感知器和反向传播进行入门级的介绍。人工神经网络是一种计算模型，启发自人类大脑处理信息的生物神经网络。人工神经网络是一种计算模型，启发自人类大脑处理信息的生物神经网络。人工神经网络在语音识别、计算机视觉和文本处理领域取

发表于 11-15 15:26 •4583次阅读

人工智能–多层感知器基础知识解读

感知器（Perceptron）是ANN人工神经网络的一个概念，由Frank Rosenblatt于1950s第一次引入。 MLP多层感知器是一种前向结构的ANN人工神经网络，多层

发表于 07-05 14:45 •6124次阅读

利用人工神经网络感知器实现双足行走机器人的稳定性控制

本文采用的神经网络感知器（Perception）是最简单的人工神经网络，它是FRosenblatt于1958年提出的具有自学习能力的感知器。在这种人工神经网络中，记忆的信息存储在连接权上，外部刺激

发表于 09-20 07:55 •2033次阅读

利用人工神经网络<b class='flag-5'>感知器</b>实现双足行走<b class='flag-5'>机器</b>人的稳定性控制

机器学习教程之机器学习导论的详细电子教材免费下载

对机器学习的定义和应用实例进行了介绍，涵盖了监督学习。贝叶斯决策理论。参数方法、多元方法、维度归约、聚类、非参数方法、决策树。线性判别式、多层

发表于 12-14 15:03 •18次下载

使用MATLAB编写单层感知器的函数免费下载

本文档的主要内容详细介绍的是使用MATLAB编写单层感知器的函数免费下载。

发表于 08-13 16:55 •4次下载

关于机器人的五大感知器官

机器视觉和传感器的应用就使得机器人的发展迈出了关键一步，人的五大感知器官与机器人感知器官对应的就

发表于 08-03 11:03 •5349次阅读

PyTorch教程5.2之多层感知器的实现

电子发烧友网站提供《PyTorch教程5.2之多层感知器的实现.pdf》资料免费下载

发表于 06-05 15:32 •0次下载

PyTorch教程-5.2. 多层感知器的实现

5.2. 多层感知器的实现¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab Colab [jax

发表于 06-05 15:43 •672次阅读

多层感知器、全连接网络和深度神经网络介绍

多层感知器（MLP）、全连接网络（FCN）和深度神经网络（DNN）在神经网络领域中扮演着重要角色，它们之间既存在紧密联系，又各具特色。以下将从定义、结构、功能及应用等方面详细阐述这三者之间的关系。

发表于 07-11 17:25 •4390次阅读

多层感知器的基本原理

多层感知器（MLP, Multi-Layer Perceptron）是一种前馈神经网络，它通过引入一个或多个隐藏层来扩展单层感知器的功能，从而能够解决复杂的非线性问题。BP网络，即基于反向传播算法

发表于 07-19 17:20 •798次阅读

搜索历史

使用多层感知器进行机器学习

评论

深度学习与数据挖掘的关系

DL：DL单层感知器Perceptron的原理及Perceptron Can not solve XOR problem

上海逻迅门磁感知器系统方案

如何使用Keras框架搭建一个小型的神经网络多层感知器

多层感知器在提高软件可维护性上的应用

对多层感知器和反向传播进行入门级的介绍

人工智能–多层感知器基础知识解读

利用人工神经网络感知器实现双足行走机器人的稳定性控制

机器学习教程之机器学习导论的详细电子教材免费下载

使用MATLAB编写单层感知器的函数免费下载

关于机器人的五大感知器官

PyTorch教程5.2之多层感知器的实现

PyTorch教程-5.2. 多层感知器的实现

多层感知器、全连接网络和深度神经网络介绍

多层感知器的基本原理