0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三种回归算法及其优缺点,将会为我们理解和选择算法提供很好的帮助

nlfO_thejiangme 来源:未知 作者:李倩 2018-03-23 15:38 次阅读

任何一个机器学习问题都有着不止一种算法来解决,在机器学习领域“没有免费的午餐”的意思就是没有一个对于所有问题都很好的算法。机器学习算法的表现很大程度上与数据的结构和规模有关。所以判断算法性能最好的办法就是在数据上运行比较结果。

不过与此同时我们对于算法的优缺点有一定的了解可以帮助我们找需要的算法。本文将会介绍三种回归算法及其优缺点,将会为我们理解和选择算法提供很好的帮助。

线性和多项式回归

在这一简单的模型中,单变量线性回归的任务是建立起单个输入的独立变量与因变量之间的线性关系;而多变量回归则意味着要建立多个独立输入变量与输出变量之间的关系。除此之外,非线性的多项式回归则将输入变量进行一系列非线性组合以建立与输出之间的关系,但这需要拥有输入输出之间关系的一定知识。训练回归算法模型一般使用随机梯度下降法(SGD)。

优点:

建模迅速,对于小数据量、简单的关系很有效;

线性回归模型十分容易理解,有利于决策分析。

缺点:

对于非线性数据或者数据特征间具有相关性多项式回归难以建模;

难以很好地表达高度复杂的数据。

神经网络

神经网络由一系列称为神经元的节点通过内部网络连接而成,数据的特征通过输入层被逐级传递到网络中,形成多个特征的线性组合,每个特征会与网络中的权重相互作用。随后神经元对线性组合进行非线性变化,这使得神经网络模型具有对多特征复杂的非线性表征能力。神经网络可以具有多层结构,以增强对于输入数据特征的表征。人们一般利用随机梯度下降法和反向传播法来对神经网络进行训练,请参照上述图解。

优点:

多层的非线性结构可以表达十分复杂的非线性关系;

模型的灵活性使得我们不需要关心数据的结构;

数据越多网络表现越好。

缺点:

模型过于复杂,难以解释;

训练过程需要强大算力、并且需要微调超参数;

对数据量依赖大,但常规机器学习问题则使用较小量数据。

回归树和回归森林

让我们从最基本的概念出发,决策树是通过遍历树的分支并根据节点的决策选择下一个分支的模型。树型感知利用训练数据作为数据,根据最适合的特征进行拆分,并不断进行循环指导训练数据被分到一类中去。建立树的过程中需要将分离建立在最纯粹的子节点上,从而在分离特征的情况下保持分离数目尽可能的小。纯粹性是来源于信息增益的概念,它表示对于一个未曾谋面的样本需要多大的信息量才能将它正确的分类。实际上通过比较熵或者分类所需信息的数量来定义。而随机森林则是决策树的简单集合,输入矢量通过多个决策树的处理,最终的对于回归需要对输出数据取平均、对于分类则引入投票机制来决定分类结果。

优点:

具有很高的复杂度和高度的非线性关系,比多项式拟合拥有更好的效果;

模型容易理解和阐述,训练过程中的决策边界容易实践和理解。

缺点:

由于决策树有过拟合的倾向,完整的决策树模型包含很多过于复杂和非必须的结构。但可以通过扩大随机森林或者剪枝的方法来缓解这一问题;

较大的随机数表现很好,但是却带来了运行速度慢和内存消耗高的问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4774

    浏览量

    100909
  • 机器学习
    +关注

    关注

    66

    文章

    8425

    浏览量

    132775

原文标题:如何为回归问题选择一个合适的算法呢?我们先从模型的优缺点讲起...

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    常见算法优缺点比较

    ,并从优中择优。但是每次都进行这一操作不免过于繁琐,下面小编来分析下各个算法优缺点,以助大家有针对性地进行选择,解决问题。1.朴素贝叶斯朴素贝叶斯的思想十分简单,对于给出的待分类项,求出在此项出现
    发表于 12-02 15:40

    FDTD和FEM算法各有什么优缺点

    以下是两位网友的回答,稍微有所调整:RanHe的回答:在讨论电磁仿真前,先要敬仰前辈。计算电磁学从大的方向可以分为两大类:全波仿真算法,高频算法。全波仿真是一精确算法,但是非常消耗计
    发表于 08-04 09:06

    回归算法之逻辑回归的介绍

    回归算法之逻辑回归
    发表于 05-21 16:25

    回归算法有哪些,常用回归算法(3)详解

    回归是数学建模、分类和预测中最古老但功能非常强大的工具之一。回归在工程、物理学、生物学、金融、社会科学等各个领域都有应用,是数据科学家常用的基本工具。回归通常是机器学习中使用的第一个算法
    发表于 07-28 14:36

    FOC中的三种电流采样方式,你知道怎么选择吗?

    ,起一个抛砖引玉的作用,希望读者能够举一反,有更优的方式。图一:三种采样方式优缺点对比本期内容我们邀请了赵云老师来给大家分享原创内容,详细的干货选型内容我已上传到附件,只需要1个积分
    发表于 03-19 13:46

    主流的三种RF方案及其优缺点对比分析

    主流的三种RF方案及其优缺点对比分析RF IC的主要性能是什么?
    发表于 05-25 06:34

    算法三种结构介绍

    嵌入式学习日记2018.11.62018.11.16理论学习阶段计算机科学导论(原书第二版)第8章 算法学到的新知识1算法三种结构:顺序、判断(选择)和重复(循环)2常用的
    发表于 11-08 07:12

    三种SPWM波形生成算法的分析与实现

    本文着重介绍三种SPWM波形生成算法的分析与实现
    发表于 08-24 16:30 12次下载

    如何提升示波器波形质量 三种波形算法的应用

    提到波形算法,容易想到示波器里数学运算功能math可以实现几十算法,完全满足应用需要,其中有个特色算法就是实时的FFT算法,可以实时显示
    发表于 04-28 09:10 3393次阅读
    如何提升示波器波形质量 <b class='flag-5'>三种</b>波形<b class='flag-5'>算法</b>的应用

    常见算法优缺点比较

    优中择优。但是每次都进行这一操作不免过于繁琐,下面小编来分析下各个算法优缺点,以助大家有针对性地进行选择,解决问题。
    发表于 02-02 15:48 6073次阅读
    常见<b class='flag-5'>算法</b><b class='flag-5'>优缺点</b>比较

    三种PCB电路板灌封胶的优缺点

    PCB板灌封胶主要有三种,分别是聚氨酯灌封胶、环氧树脂灌封胶、有机硅灌封胶。在制备PCB板过程中该如何选择灌封胶呢?下面为大家具体分析下三种灌封胶的优缺点
    的头像 发表于 09-14 10:22 2.2w次阅读

    三种失电延装置的构成原理及优缺点

    从安装失电延释装置的必要性出发,介绍了三种失电延装置的构成、原理、动作及优缺点,其中的两是采用设置高压电解电容提供接触器的吸合大电流,低压电解电容
    的头像 发表于 10-29 11:22 3298次阅读
    <b class='flag-5'>三种</b>失电延装置的构成原理及<b class='flag-5'>优缺点</b>

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    机器学习算法总结 机器学习算法是什么?机器学习算法优缺点? 机器学习算法总结 机器学习算法是一
    的头像 发表于 08-17 16:11 1956次阅读

    光耦隔离 电容隔离 磁隔离这三种隔离方式各有什么优缺点

    光耦隔离、电容隔离和磁隔离是三种常见的隔离方式,它们各有优缺点,适用于不同的应用场景。
    的头像 发表于 01-30 15:38 6178次阅读

    神经网络算法优缺点有哪些

    神经网络算法是一模拟人脑神经元结构的计算模型,广泛应用于机器学习、深度学习、图像识别、语音识别等领域。然而,神经网络算法也存在一些优缺点。本文将详细分析神经网络
    的头像 发表于 07-03 09:47 1481次阅读