0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广义线性模型介绍

8g3K_AI_Thinker 来源:人工智能头条 2019-11-22 15:10 次阅读

本文介绍了广义线性模型,其中线性回归、logistic回归,softmax回归同属于广义线性模型。从指数分布家族推导出高斯分布、伯努利分布对应的指数分布家族形式,以最大化期望为目标推导出线性回归、logistic回归,softmax回归的目标函数,进一步强调模型的概率解释性。

广义线性模型

从线性回归,logistic回归,softmax回归,最大熵的概率解释来看,我们会发现线性回归是基于高斯分布+最大似然估计的结果,logistic回归是伯努利分布+对数最大似然估计的结果,softmax回归是多项分布+对数最大似然估计的结果,最大熵是基于期望+对数似然估计的结果。前三者可以从广义线性模型角度来看。

A、指数分布家族

指数分布家族是指可以表示为指数形式的概率分布,指数分布的形式如下:

其中是分布的自然参数,是充分统计量,通常. 当参数都固定的时候,就定义了一个以为参数的函数族。

实际上大多数的概率分布都属于指数分布家族,比如:

1)伯努利分布 0-1问题

2)二项分布,多项分布 多取值 多次试验

3)泊松分布 计数过程

4)伽马分布与指数分布

5)分布

6)Dirichlet分布

7)高斯分布

现在我们将高斯分布和伯努利分布用指数分布家族的形式表示:

高斯分布:


对应到指数分布家族有:


伯努利分布:


对应到指数分布家族有:

B、广义线性模型

在了解指数分布家族之后,我们再来看广义线性模型的形式定义与假设:

1)给定样本x与参数,样本分类y服从指数分布家族的某个分布。

2)给定一个x,我们目标函数为:

3)

三条假设,第一条是为了能在指数分布范围内讨论y的概率,第二条假设是为了使得预测值服从均值为实际值得一个分布,第三条假设是为了设计的决策函数(模型)是线性的。

由高斯分布的指数家族分布形式与广义线性模型的定义有线性回归的模型为:


同样由伯努利分布的指数家族分布形式与广义线性模型的定义有logistic回归的模型为(解释了为什么是sigmoid函数):


所以,在广义线性模型中,决策函数为线性函数是基于广义线性模型的第三条假设,而最终的模型是依赖于模型服从什么样的分布,比如 高斯分布,伯努利分布。

同样,我们应用logistic回归到softmax回归的一套定义,下面再来看多项分布对应的softmax回归:


其中是表示的概率,是一个指示函数,为真是取值为,否则为,采用softmax中向量化的定义。

对应到指数分布家族有:


由推出:

为了方便定义,由于多项分布所有值取值概率加和为1有:

所以有:

再由广义线性模型的第二条假设,同时将第三条线性假设带入有:

最后由最大似然估计有softmax的目标函数如下:

到此,广义线性模型解释线性回归,logistic回归,softmax回归基本算完,可以看出线性函数是基于广义线性模型的第三条假设,采用sigmoid函数是因为伯努利分布,而softmax回归是logistic回归高维推广。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    4327

    浏览量

    62574
  • 线性
    +关注

    关注

    0

    文章

    198

    浏览量

    25146
  • 模型
    +关注

    关注

    1

    文章

    3229

    浏览量

    48810

原文标题:【机器学习】知否?知否?广义线性模型

文章出处:【微信号:AI_Thinker,微信公众号:人工智能头条】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是大模型、大模型是怎么训练出来的及大模型作用

    本文通俗简单地介绍了什么是大模型、大模型是怎么训练出来的和大模型的作用。   什么是大模型模型
    的头像 发表于 11-25 09:29 1227次阅读
    什么是大<b class='flag-5'>模型</b>、大<b class='flag-5'>模型</b>是怎么训练出来的及大<b class='flag-5'>模型</b>作用

    构建语音控制机器人 - 线性模型和机器学习

    轮子并识别音频信号,但它仍然无法通过语音命令控制或按预定义路径行驶。 线性控制模型 首先要解决的问题是实现直线驱动。为此,我们使用线性模型来控制提供给车轮的电压。使用
    的头像 发表于 10-02 16:31 208次阅读
    构建语音控制机器人 - <b class='flag-5'>线性</b><b class='flag-5'>模型</b>和机器学习

    什么是电路模型?它有什么意义

    包括了电路中的电压、电流、电阻、电容、电感等基本物理量,以及它们之间的关系。电路模型通常用电路图来表示,电路图中的各个元件用符号表示,元件之间的连接关系用线条表示。 二、电路模型的分类 线性电路
    的头像 发表于 08-22 16:38 2769次阅读

    电路模型和实际电路的区别是什么

    以下是对这些方面的简要介绍: 电路模型的概念和分类 电路模型是对实际电路的一种抽象和简化,用于描述电路中各个元件之间的相互作用和电流、电压的变化规律。电路模型通常分为
    的头像 发表于 08-22 16:36 1230次阅读

    【《大语言模型应用指南》阅读体验】+ 俯瞰全书

    ,了解此书的主要内容: 书分四篇,基础、入门、进阶和展望。 基础篇从人工智能起源开始、之后又介绍了机器学习、神经网络和大语言模型的基础知识,如果读者学习过机器学习相关课程,那这个基础篇的阅读就会很轻
    发表于 07-21 13:35

    MATLAB预测模型哪个好

    在MATLAB中,预测模型的选择取决于数据类型、问题复杂度和预测目标。以下是一些常见的预测模型及其适用场景的介绍线性回归(Linear Regression):
    的头像 发表于 07-11 14:31 419次阅读

    matlab预测模型有哪些

    环境,使其成为预测模型开发和实现的理想平台。本文将详细介绍MATLAB中常用的预测模型及其应用。 线性回归模型
    的头像 发表于 07-11 14:27 749次阅读

    什么是线性电路和非线性电路

    线性电路和非线性电路是电子学中两个基本的概念。它们的区别主要在于电路元件的输入-输出关系是否满足线性关系。下面我们将介绍线性电路和非
    的头像 发表于 07-09 11:14 3783次阅读

    arimagarch模型怎么预测

    ARIMA-GARCH模型是一种时间序列预测方法,它结合了自回归积分滑动平均(ARIMA)模型广义自回归条件异方差(GARCH)模型。ARIMA
    的头像 发表于 07-09 10:22 468次阅读

    arma-garch模型的建模步骤

    ARMA-GARCH模型是一种常用于金融市场时间序列数据的建模方法,它结合了自回归移动平均(ARMA)模型广义自回归条件异方差(GARCH)模型的优点。以下是ARMA-GARCH
    的头像 发表于 07-09 10:20 625次阅读

    lp模型的要素、组成部分及特征

    。本文将介绍线性规划模型的要素、组成部分及特征。 一、线性规划模型的要素 目标函数(Objective Function):目标函数是
    的头像 发表于 07-09 10:10 918次阅读

    LLM模型和LMM模型的区别

    LLM(线性混合模型)和LMM(线性混合效应模型)之间的区别如下: 定义: LLM(线性混合模型
    的头像 发表于 07-09 09:57 928次阅读

    数学建模神经网络模型的优缺点有哪些

    、预测分析等。然而,神经网络模型也存在一些优缺点。本文将详细分析神经网络模型的优缺点。 一、优点 强大的非线性拟合能力 神经网络模型具有强大的非线性
    的头像 发表于 07-02 11:36 898次阅读

    MES深化应用五级成熟度模型介绍

    电子发烧友网站提供《MES深化应用五级成熟度模型介绍.docx》资料免费下载
    发表于 02-23 17:10 1次下载

    SPICE中的热模型介绍

    SPICE模型中的热模型是指用于模拟和预测电子元件在工作时的热行为特性的模型。这些模型通常与电路仿真软件一起使用,以便在设计阶段评估和优化电子系统的热性能。热
    的头像 发表于 02-06 11:28 1082次阅读
    SPICE中的热<b class='flag-5'>模型</b><b class='flag-5'>介绍</b>