0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习技术的理论背景

星星科技指导员 来源:嵌入式计算设计 作者:Sorin Mihai 2022-12-02 14:53 次阅读

机器学习可以定义为一组算法,有助于根据过去的学习进行预测。

在机器学习算法中,输入数据被组织为数据点。每个数据点都由描述所表示数据的特征组成。例如,尺寸和速度是可以将汽车与街道上的自行车区分开来的特征。汽车的大小和速度通常都高于自行车。机器学习方法的目标是将输入数据转换为有意义的输出,例如将输入数据分类为汽车和非汽车数据点或对象。输入通常写为向量,由多个数据点组成。输出写为。xy

二维或三维输入数据可以在所谓的特征空间中进行说明和查看,其中每个数据点都相对于其特征绘制。图 8 (a) 显示了描述汽车和非汽车对象的二维特征空间的简化示例。x

pYYBAGOJoQyAbFX-AADvWuiesyU971.png

图8.根据汽车和非汽车物体的大小和速度对汽车和非汽车对象进行分类:特征空间(a)以及两个类(b)之间的相应间隔。

所谓的学习映射函数或,给出特征向量之间的差异(例如,分类为汽车和非汽车数据点)。该模型的结构范围从简单的线性函数(例如图 8 (a) 中的汽车和非汽车对象的线划分)到复杂的非线性神经网络。学习方法的目标是确定系数的值,这些系数表示可用输入数据中的模型参数。映射函数的输出是算法对输入数据描述内容的预测。model,h_θ (x)θ-

机器学习方法可以根据映射函数的学习方式进行分类(图 9)。有三种可能性:

监督学习 –映射函数是根据训练数据对计算的,其中预先知道的输出在训练阶段单独提供给学习算法。计算出模型参数后,可以将模型部署到目标应用程序中。当它收到未知数据点时,它的输出将是预测值。yy

无监督学习 –在这种情况下,与监督学习相比,在训练阶段没有可用的特征标签对。学习算法的输入仅包含未标记的数据点。这种机器学习方法的目标是直接从输入特征在特征空间中的分布中推断出输入特征的标签。x

强化(半监督)学习 –在这种情况下,训练数据也没有标签,但构建模型是为了通过一组操作促进与其环境的交互。映射函数将环境的状态映射到操作,该状态由输入数据提供给操作。奖励信号指示操作在环境的特定状态下的性能。当信号表明积极影响时,学习算法会加强动作。如果识别出负面影响,该算法将阻止环境的特定操作或状态。

poYBAGOJoRKAcNGOAAC6Ms7t080094.png

图9.基于训练方法的机器学习算法分类。

深度学习革命

近年来,所谓的深度学习范式彻底改变了机器学习领域。深度学习通过解决以前传统模式识别方法无法解决的挑战,对机器学习社区产生了巨大影响(LeCun et al. 2015)。深度学习的引入极大地提高了专为视觉识别、对象检测语音识别、异常检测或基因组学而设计的系统精度。深度学习的关键方面是,用于解释数据的特征是从训练数据中自动学习的,而不是由工程师手动制作的。

pYYBAGOJoRiAHmdEAAFZ8FQXLFk467.png

图 10.经过训练的深度卷积神经网络可以识别图像中的汽车。

到目前为止,构建良好的模式识别算法的主要挑战是手动设计用于分类的手工制作的特征向量,例如早期版本的交通标志识别系统中使用的局部二进制模式,如第 1 部分所述。深度学习的出现已经用学习算法取代了特征向量的手动工程,该算法可以自动发现原始输入数据中的重要特征。

在架构上,深度学习系统由多层非线性单元组成,可以将原始输入数据转换为更高级别的抽象。每个层将前一层的输出映射到适用于回归或分类任务的更复杂的表示中。这种学习通常在深度神经网络上进行,该网络通过使用反向传播算法进行训练。该算法迭代地调整网络的参数或权重,以模拟输入训练数据。因此,网络在训练结束时学习了输入数据点的复杂非线性映射函数。

图 10 显示了深度神经网络的符号表示,该网络经过训练以识别图像中的汽车。输入层表示原始输入像素。隐藏层 1 通常模拟图像某些位置和方向中边缘的存在与否。第二个隐藏层使用在前一层中计算的边对对象零件进行建模。第三个隐藏层构建了建模对象的抽象表示,在我们的例子中,这是汽车的成像方式。输出层根据第三个隐藏层的高级特征计算给定图像包含汽车的概率。

不同的网络架构源于神经网络的单元和层的分布方式。所谓的感知器是最简单的,由单个输出神经元组成。通过构建感知器可以获得大量的神经网络风格。这些网络中的每一个都比其他网络更适合特定的应用程序。图 11 显示了近年来创建的众多神经网络架构中最常见的三种。

深度前馈神经网络(图11a)是一种结构,其中两个相邻层之间的神经元完全互连,并且信息流仅在一个方向上,从系统的输入到输出。这些网络可用作通用分类器,并用作所有其他类型的深度神经系统的基础。

pYYBAGOJoR6AZdV3AAHCD7wYZyk704.png

图 11.深度神经网络架构(来源:www.asimovinstitute.org)

深度卷积神经网络(图11b)改变了视觉感知方法的发展方式。此类网络由交替的卷积层和池化层组成,这些层通过从输入数据进行泛化来自动学习对象特征。这些学习到的特征被传递到一个完全互连的前馈网络进行分类。这种类型的卷积网络是图 10 所示汽车检测架构和第1 部分描述的用例的基础。

虽然深度卷积网络对视觉识别至关重要,但深度递归神经网络(图11c)对于自然语言处理至关重要。由于隐藏层中神经元之间的自递归连接,这种架构中的信息是时间依赖性的。网络的输出可能因数据馈入网络的顺序而异。例如,如果在单词“mouse”之前输入单词“cat”,则会获得一定的输出。现在,如果输入顺序发生变化,输出顺序也可能更改。

机器学习算法的类型

尽管深度神经网络是复杂机器学习挑战中最常用的解决方案之一,但还有各种其他类型的机器学习算法可用。表1根据其性质(连续或离散)和训练类型(有监督或无监督)对它们进行分类。

poYBAGOJoSaAHXsZAAG92O9k-nc143.png

表 1.机器学习算法的类型

机器学习估计器可以根据其输出值或训练方法大致分类。如果后者估计连续值函数(即连续输出),则该算法被归类为回归估计器。当机器学习算法的输出是离散变量时,该算法称为分类器。第 1 部分中描述的交通标志检测和识别系统是此类算法的实现。y

? Ry ? {0,1,…,q}

异常检测是无监督学习的一种特殊应用。此处的目标是识别数据集中的异常值或异常。异常值定义为特征向量,与应用程序中常见的特征向量相比,这些特征向量具有不同的属性。换句话说,它们在特征空间中占据不同的位置。

表 1 还列出了一些流行的机器学习算法。下面简要解释这些内容。

线性回归是一种回归方法,用于将线、平面或超平面拟合到数据集。拟合模型是一个线性函数,可用于对实值函数进行预测。y

逻辑回归是线性回归方法的离散对应物,其中映射函数给出的预测实际值被转换为概率输出,该输出表示输入数据点对某个类的成员资格。

朴素贝叶斯分类器是一组基于贝叶斯定理构建的机器学习方法,该定理假设每个特征都独立于其他特征。

支持向量机 (SVM) 旨在使用所谓的边距计算类之间的分离。边距的计算尽可能宽,以便尽可能清楚地分隔类。

集成方法,如决策树、运行dom 森林或AdaBoost组合了一组基础分类器,有时称为“弱”学习器,目的是获得“强”分类器。

神经网络是机器学习算法,其中回归或分类问题由一组称为神经元的互连单元解决。从本质上讲,神经网络试图模仿人脑的功能。

K-均值聚类是一种用于将具有共同属性的特征分组在一起的方法,即它们在特征空间中彼此接近。k 均值根据要分组的给定聚类数,以迭代方式将常见要素分组到球形聚类中。

均值偏移也是一种数据聚类技术,对于异常值而言,该技术更为通用和稳健。与 k 均值相反,均值偏移只需要一个优化参数(搜索窗口大小),并且不假定数据聚类的球形先验形状。

主成分分析 (PCA) 是一种数据降维技术,它将一组可能相关的特征转换为一组名为主成分的线性不相关变量。主成分按方差顺序排列。第一个分量的变化最大;第二个在此之下有下一个变体,依此类推。

第三部分在功能安全要求的背景下评估这些机器学习算法。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8373

    浏览量

    132393
  • 深度学习
    +关注

    关注

    73

    文章

    5491

    浏览量

    120958
收藏 人收藏

    评论

    相关推荐

    ASR和机器学习的关系

    自动语音识别(ASR)技术的发展一直是人工智能领域的一个重要分支,它使得机器能够理解和处理人类语言。随着机器学习(ML)技术的迅猛发展,AS
    的头像 发表于 11-18 15:16 169次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要以数据的形式存在,因此机器学习需要设法对数据进行分析学习,这就使得它逐渐成为智能数据分析技术的创新源之一,
    的头像 发表于 11-16 01:07 188次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 258次阅读

    人工智能、机器学习和深度学习存在什么区别

    人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术,但其中一个很大的子集是机器学习——让算法从数据中学习
    发表于 10-24 17:22 2436次阅读
    人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

    DaVinci技术背景和规格

    电子发烧友网站提供《DaVinci技术背景和规格.pdf》资料免费下载
    发表于 10-09 09:29 0次下载
    DaVinci<b class='flag-5'>技术</b><b class='flag-5'>背景</b>和规格

    【「时间序列与机器学习」阅读体验】时间序列的信息提取

    。 时间序列的单调性理论是数学求导。下面是使用EWMA分析股票价格变动,以决定买入还是卖出。通过仿真数据,这种指数移动平均的技术剔除了短期波动,有助看清股票整体趋势。 通过对本章学习,对时间序列的研究目的、方法与特征有了较全
    发表于 08-17 21:12

    【「时间序列与机器学习」阅读体验】+ 鸟瞰这本书

    清晰,从时间序列分析的基础理论出发,逐步深入到机器学习算法在时间序列预测中的应用,内容全面,循序渐进。每一章都经过精心设计,对理论知识进行了详细的阐述,对实际案例进行了生动的展示,使读
    发表于 08-12 11:28

    【《时间序列与机器学习》阅读体验】+ 了解时间序列

    收到《时间序列与机器学习》一书,彩色印刷,公式代码清晰,非常精美。感谢作者,感谢电子发烧友提供了一个让我学习时间序列及应用的机会! 前言第一段描述了编写背景: 由此可知,这是一本关于时
    发表于 08-11 17:55

    机器人视觉技术中图像分割方法有哪些

    机器人视觉技术是人工智能领域的一个重要分支,它涉及到图像处理、模式识别、机器学习等多个学科。图像分割是机器人视觉
    的头像 发表于 07-04 11:34 745次阅读

    机器学习算法原理详解

    机器学习作为人工智能的一个重要分支,其目标是通过让计算机自动从数据中学习并改进其性能,而无需进行明确的编程。本文将深入解读几种常见的机器学习
    的头像 发表于 07-02 11:25 733次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于
    的头像 发表于 07-01 11:40 1171次阅读

    名单公布!【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来?

    和专业知识,对这一领域进行系统的梳理和总结。然而,将时间序列分析与机器学习技术相结合的书籍却并不多见。 以上正是《时间序列与机器学习》这本“
    发表于 06-25 15:00

    深入探讨机器学习的可视化技术

    机器学习可视化(简称ML可视化)一般是指通过图形或交互方式表示机器学习模型、数据及其关系的过程。目标是使理解模型的复杂算法和数据模式更容易,使技术
    发表于 04-25 11:17 372次阅读
    深入探讨<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的可视化<b class='flag-5'>技术</b>

    如何使用TensorFlow构建机器学习模型

    在这篇文章中,我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。
    的头像 发表于 01-08 09:25 907次阅读
    如何使用TensorFlow构建<b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型

    机器视觉照明技术基础知识概述

    机器视觉(machine vision)照明技术主要任务为提升被测物体特征与背景之间的对比度。
    的头像 发表于 12-18 17:36 1166次阅读
    <b class='flag-5'>机器</b>视觉照明<b class='flag-5'>技术</b>基础知识概述