0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种广义的线性回归分析模型:逻辑回归

鼎酷IOT部落 来源:未知 作者:李倩 2018-05-25 15:29 次阅读

逻辑回归又称逻辑回归分析,是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。

逻辑回归是始于输出结果为实际意义的连续值的线性回归,因此与多重性线性回归分析有很多的相同之处。

逻辑回归模型

逻辑回归是一种极易理解的模型,就相当于y=f(x),表明自变量x与因变量y的关系。最常见的问题如:医生治病时的望闻问切,之后判断病人是否生病或生了什么病,其中的望闻问切就是获取自变量x,即特征数据,判断是否生病就相当于获取因变量y,及预测分类。

图1 线性回归示例

最简单的回归就是线性回归,借用Andrew NG的讲义来说,如图1.a所示,x为数据点---肿瘤的大小,y为观测值---是否有恶性肿瘤。通过构建线性回归模型,如hθ(x)所示,构建线性回归模型后,既可以根据肿瘤大小,预测是否为恶性肿瘤hθ(x)≥0.5为恶性,hθ(x)<0.5为良性。

同时线性回归的鲁棒性很差,例如在图1.b的数据集上建立回归,因最右边噪点的存在,使回归模型在训练集上表现都很差。这主要是由于线性回归在整个实数域内敏感度一致,而分类范围,需要在[0,1]。逻辑回归就是一种减少预测范围,将预测值限定为[0,1]间的一种回归模型,其回归方程与回归曲线如图2所示。逻辑曲线在z=0时,十分敏感,在z>>0或z<<0处,都不敏感,将预测值限定为(0,1)。

图2 逻辑方程与逻辑曲线

逻辑回归其实仅为在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函数,逻辑回归成为了机器学习领域一颗耀眼的明星,更是计算广告学的核心,对于多元逻辑回归,可用如下公式似和分类,其中公式(4)的变换,将在逻辑回归模型参数估计时,化简公式带来很多益处,y={0,1}为分类结果。

2. 判定边界

为什么逻辑回归能够解决分类问题呢?我们可以用判定边界来解释,可以理解为是用对不同类别的数据分割的边界,边界的两旁应该是不同类别的数据。

从二维直角坐标系中,举几个例子,大概是如下这三种类型:

从上述三幅图中,红绿样本点为不同类别的样本,而我们划出的线,不管是直线、圆或者是曲线,都能比较好地将图中的两类样本分隔开,这就是我们所说的判定边界,那么逻辑回归是如何根据样本点来获得这些判定边界的呢?

我们依旧借用Andrew NG教授的课程中部分例子来讲述这个问题。

回到sigmoid函数,我们发现,当g(z)≥0.5时, z≥0;对于hθ(x)=g(θTX)≥0.5, 则θTX≥0, 此时意味着预估y=1;反之,当预测y = 0时,θTX<0; 所以我们认为θTX =0是一个决策边界,当它大于0或小于0时,逻辑回归模型分别预测不同的分类结果。先看第一个例子hθ(x)=g(θ0+θ1X1+θ2X2),其中θ0 ,θ1 ,θ2分别取-3, 1, 1。则当−3+X1+X2≥0时, y = 1; 则X1+X2=3是一个决策边界,图形表示如下,刚好把图上的两类点区分开来:

例1只是一个线性的决策边界,当hθ(x)更复杂的时候,我们可以得到非线性的决策边界,例如:

这时当x12+x22≥1时,我们判定y=1,这时的决策边界是一个圆形,如下图所示:

所以我们发现,理论上说,只要我们的hθ(x)设计足够合理,准确的说是g(θTx)中θTx足够复杂,我们能在不同的情形下,拟合出不同的判定边界,从而把不同的样本点分隔开来。

直观地在二维空间理解逻辑回归,是singmoid函数的特征,使得判定的阈值能够映射为平面的一条判定边界,当然随着特征的复杂化,判定边界可能是多种多样的样貌,但是它能够较好地把两类样本点分隔开,解决分类问题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 逻辑
    +关注

    关注

    2

    文章

    833

    浏览量

    29485
  • 机器学习
    +关注

    关注

    66

    文章

    8422

    浏览量

    132730

原文标题:机器学习|一文带你读懂什么是逻辑回归

文章出处:【微信号:dkiot888,微信公众号:鼎酷IOT部落】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    matlab回归分析总结

    1、多元线性回归2、多项式回归3、非线性回归4、逐步回归[hide][/hide]
    发表于 03-20 10:26

    浅析逻辑回归

    ML-逻辑回归-公式推导- 多种实现
    发表于 04-25 15:35

    回归算法之逻辑回归的介绍

    回归算法之逻辑回归
    发表于 05-21 16:25

    回归算法有哪些,常用回归算法(3)详解

    逻辑回归。另一种用于两个或更多输出变量的常见技术是 OneVsAll。对于多类型逻辑回归,交叉熵损失函数被修改为: 其中,K 是类别总数。更
    发表于 07-28 14:36

    TensorFlow实现简单线性回归

    。可以对数据进行归化处理: 为训练数据声明 TensorFlow 占位符: 创建 TensorFlow 的权重和偏置变量且初始值为零: 定义用于预测的线性回归模型: 定义损失函数:
    发表于 08-11 19:34

    TensorFlow实现多元线性回归(超详细)

    在 TensorFlow 实现简单线性回归的基础上,可通过在权重和占位符的声明中稍作修改来对相同的数据进行多元线性回归。在多元线性
    发表于 08-11 19:35

    如何用C语言实现个简单的线性回归算法

    今天我们用C语言实现个简单的线性回归算法;在代码前面我们在回顾一下线性回归线性
    发表于 07-20 06:34

    8 进行简单线性回归的方法分析与讨论

    本文中,作者讨论了 8 在 Python 环境下进行简单线性回归计算的算法,不过没有讨论其性能的好坏,而是对比了其相对计算复杂度的度量。 对于大多数数据科学家而言,线性
    发表于 01-05 08:18 1w次阅读
    8 <b class='flag-5'>种</b>进行简单<b class='flag-5'>线性</b><b class='flag-5'>回归</b>的方法<b class='flag-5'>分析</b>与讨论

    基于Weierstrass逼近定理在非线性回归模型中应用

    基于Weierstrass逼近定理,阐释了将般非线性回归模型近似为多项式模型来处理的数学原理,从而引入了把多元非线性回归
    发表于 01-12 09:59 0次下载

    8用Python实现线性回归的方法对比分析_哪个方法更好?

    谈谈线性回归。没错,作为数据科学界元老级的模型线性回归几乎是所有数据科学家的入门必修课。抛开涉及大量数统的
    的头像 发表于 06-28 09:53 4406次阅读

    掌握logistic regression模型,有必要先了解线性回归模型和梯度下降法

    先回想一下线性回归线性回归模型帮助我们用最简单的线性方程实现了对数据的拟合,然而,这只能完成
    的头像 发表于 06-04 11:31 7621次阅读
    掌握logistic regression<b class='flag-5'>模型</b>,有必要先了解<b class='flag-5'>线性</b><b class='flag-5'>回归</b><b class='flag-5'>模型</b>和梯度下降法

    广义线性模型介绍

    ,softmax回归是多项分布+对数最大似然估计的结果,最大熵是基于期望+对数似然估计的结果。前三者可以从广义线性模型角度来看。
    的头像 发表于 11-22 15:10 4320次阅读

    机器学习的线性回归分析

    线性回归是利用数理统计中回归分析,来确定两或两以上变量间相互依赖的定量关系的
    的头像 发表于 01-23 17:33 2992次阅读
    机器学习的<b class='flag-5'>线性</b><b class='flag-5'>回归</b><b class='flag-5'>分析</b>

    机器学习的回归分析回归方法

    根据受欢迎程度,线性回归逻辑回归经常是我们做预测模型时,且第个学习的算法。但是如果认为
    的头像 发表于 01-19 17:22 3899次阅读

    基于低秩表示的鲁棒线性回归模型

    数据干净部分,并将其应用于线性回归分类,从而提升回归性能。在 Extend Yaleb、AR、ORL和PIE人脸数据集上的实验结果表明,与标准线性
    发表于 05-28 10:56 4次下载