搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

基于条件概率分类的两种模型算法：logistic回归模型与最大熵模型。

条件概率是机器学习模型的一种表现形式，应用这一模型，对于给定的输入X，得到各输出类的概率，选择最大概率的类为输出类，如下图：

本文介绍基于条件概率分类的两种模型算法：逻辑斯蒂（logistic）回归与最大熵模型，其中，logistic回归模型和最大熵模型分别是基于最大似然函数和熵来估计模型P(y|x)。公众号已有logistic回归模型的文章介绍，本文重点分析最大熵模型算法。

目录

1. 最大熵模型算法

2. 最大熵模型例子

3. 最大熵模型在信号检测的应用

4. logsitic回归模型算法

5. 总结

1.最大熵模型算法

熵是衡量随机变量不确定性的指标，熵越大，随机变量的不确定性亦越大。假设X是一个离散型随机变量，其概率分布为：

随机变量X的熵定义为：

熵满足下列不等式：

式中，|X|是x的取值个数，当且仅当X的分布是均匀分布时，右边的等号成立，也就是说，当X服从均匀分布时，熵最大。

1.1 最大熵模型的定义

最大熵原理是概率模型学习的一个准则，最大熵原理认为，学习概率模型时，在所有可能的概率模型（分布）中，熵最大的模型是最好的模型。条件概率是机器学习模型的一种表现形式，学习该模型的一种方法是最大化该条件概率的熵，即最大化下式：

其中表示变量X的经验分布：

其中v(X=x)表示训练数据中输入x出现的频数，N表示样本容量。

（1）式的未知变量就是需要学习的模型。

我们在构建分类模型的过程中假设训练数据集的联合概率分布与真实模型的联合概率分布相等，这一假设用特征函数f(x,y)的期望来描述，特征函数的定义：

特征函数f(x,y)关于训练数据集的联合概率分布的期望值，用表示：

其中，

，v(X=x,Y=y)表示训练数据中样本(x,y)出现的频数。

特征函数f(x,y)关于模型与经验分布的期望值，用表示：

假设两者期望相等，即：

或

结合(1)(4)式，得到最大熵模型：

约束条件：

1.2 最大熵模型的学习

我们求解(5)式在约束条件下的最大值，其对应的模型P(Y|X)就是所学习的最优模型。

对于给定的训练数据集以及特征函数，i=1,2,...,n，最大熵模型的学习等价于约束最优化问题：

将最大值问题转化为等价的求最小值问题：

引入拉格朗日乘子将约束的最优化问题转换为无约束最优化的对偶问题，通过求解对偶问题求解原始问题。

定义拉格朗日函数L(P,w)：

最优化的原始问题：

对偶问题：

令

得：

由于，对上式进行归一化得：

其中，

令

易知对偶问题外部的极大化问题：

根据上式求解的代入(2.4)式，得到最终的学习模型P(y|x)。

2. 最大熵模型例子

假设随机变量Y有5个取值，假设随机变量Y的条件概率分布满足如下条件：

求最大熵模型对应的概率分布P(Y)。

最大熵模型的目标函数：

引进拉格朗日乘子，定义拉格朗日函数：

令，得：

将上式代入函数L(P,w)得，令，得：

于是最大熵模型对应的概率分布：

3. 熵模型在信号检测的应用

由第一节我们知道，熵是描述事物不确定性的指标。我们将熵的这一性质应用在信号检测领域，当信号包含了较强的随机噪声时或被噪声完全掩盖时，信号的随机性大大的增加了，其对应的熵也较大，根据这一原理对信号的质量进行检测，下图是用熵检测心电信号质量的效果图：

黑色表示较好的心电信号质量，红色表示较差的心电信号质量。

4. logistic回归算法

logistic回归是一种概率分类模型，对于二分类任务来说，其条件概率分布：

我们用最小化损失函数去估计上式的模型参数。对于给定的训练数据集，其中，。

设：

似然函数为：

对数似然函数为：

损失函数为：

用梯度下降法求解w的估计值：

代入（2.1）（2.2）式，得到逻辑斯蒂回归模型P(y|x)，其中向量包含了b值。

5. 小结

本文介绍基于条件概率分类的两种模型算法：logistic回归模型与最大熵模型，其中，logistic回归模型是基于最大似然函数估计模型P(y|x)，最大熵模型是基于熵这一指标估计模型P(y|x)。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3406

浏览量
49457
机器学习

机器学习

+关注

关注
66

文章
8459

浏览量
133374
Logistic

Logistic

+关注

关注
0

文章
11

浏览量
8887

原文标题：最大熵模型算法总结

文章出处：【微信号：AI_shequ，微信公众号：人工智能爱好者社区】欢迎添加关注！文章转载请注明出处。

评论

相关推荐

利用机器学习和大数据何建立信用评分的模型

利用Logistic回归拟合信用评分卡模型

发表于 04-19 16:27

机器学习之偏差、方差，生成模型，判别模型，先验概率，后验概率

机器学习：偏差、方差，生成模型，判别模型，先验概率，后验概率

发表于 05-14 15:23

回归算法有哪些，常用回归算法（3种）详解

随机梯度下降来估计系数。损失函数通常被定义为交叉熵项：逻辑回归用于分类问题，例如，对于给定的医疗数据，可以使用逻辑回归判断一个人是否患有癌症。如果输出类别变量具有

发表于 07-28 14:36

Edge Impulse的回归模型

Edge Impulse的回归模型可以从数据中学习模式，并将其应用于新数据。非常适合预测数字连续值。

发表于 12-20 06:21

使用KNN进行分类和回归

一般情况下k-Nearest Neighbor (KNN)都是用来解决分类的问题，其实KNN是一种可以应用于数据分类和预测的简单算法，本文中我们将它与简单的线性

发表于 10-28 14:44

基于概率粗糙集模型的信息检索

针对经典粗糙集模型难以分类标引空间以及体现类间关联的缺陷，将条件概率关系结合粗糙集理论引入信息检索，提出一种基于

发表于 04-10 08:47 •10次下载

LTL概率模型检验工具的实现与优化

概率模型检验建立在非概率模型检验技术的基础上，不仅能够对系统进行定性的验证，还能够定量判断系统满足相关性质的概率，具有广泛的适用性。LTL

发表于 11-21 15:09 •6次下载

LTL<b class='flag-5'>概率</b><b class='flag-5'>模型</b>检验工具的实现与优化

基于Wasserstein距离概率分布模型的非线性降维算法

降维是大数据分析和可视化领域中的核心问题，其中基于概率分布模型的降维算法通过最优化高维数据模型和低维数据模型之间的代价函数来实现降维。这种策

发表于 11-24 17:13 •3次下载

基于概率主题模型的景点主题模型

针对旅游文本噪声多、景点多且展示不直观的问题，提出一种基于概率主题模型的景点一主题模型。模型假设同一篇文档涉及多个具有相关关系的景点，引入全

发表于 12-13 14:07 •3次下载

掌握logistic regression模型，有必要先了解线性回归模型和梯度下降法

先回想一下线性回归，线性回归模型帮助我们用最简单的线性方程实现了对数据的拟合，然而，这只能完成回归任务，无法完成分类任务，那么 logist

的头像

发表于 06-04 11:31 •7701次阅读

掌握<b class='flag-5'>logistic</b> regression<b class='flag-5'>模型</b>，有必要先了解线性<b class='flag-5'>回归</b><b class='flag-5'>模型</b>和梯度下降法

如何使用概率模型进行非均匀数据聚类算法的设计介绍

针对传统K-means型算法的“均匀效应”问题，提出一种基于概率模型的聚类算法。首先，提出一个描述非均匀数据簇的高斯混合分布

发表于 12-13 10:57 •10次下载

基于交叉熵算法的跟驰模型标定

的确定性标定方法会导致大量局部最优值的出现。在此基础上，本文提出了基于交叉熵算法的跟驰模型标定的框架，基于蒙地卡罗与重要样本策略逐步逼近参数的最优概率密度函数。实例分别采用合成数据与实

发表于 01-11 16:23 •8次下载

基于交叉<b class='flag-5'>熵</b><b class='flag-5'>算法</b>的跟驰<b class='flag-5'>模型</b>标定

广义线性模型介绍

从线性回归，logistic回归，softmax回归，最大熵的

的头像

发表于 11-22 15:10 •4412次阅读

基于直方图条件熵的水声数据分类算法

水声数据中目标的不确定性以及各种物质的声纳数据值的杂合程度，使基于直方图最大值和直方图熵的算法都不能很好地解决水声数据分类的问题。为此，提出一种

发表于 04-21 10:12 •9次下载

机器学习常用的十大算法

二项logistic回归模型是一种分类模型，由条件

发表于 10-16 10:10 •2123次阅读

精选推荐
更多

文章

资料

帖子

功率放大器测试解决方案分享——电致发光纤维特性研究

Aigtek安泰电子
16小时前

45 阅读

客户案例分享 | ATA-4014C高压功率放大器在电流传感器性能测试实验中的应用

Aigtek安泰电子
16小时前

61 阅读

漫话昇腾之《一体机请就位》

脑极体
11小时前

148 阅读

MWC2025，读懂全球运营商的能源与智能双重奏

脑极体
2小时前

185 阅读

安森美分析图像传感器的选择标准

安森美
18小时前

234 阅读

德州仪器功率电池管理解决方案

jackhui
457 KB

5积分

39下载

baseRecyclerViewAdapterHelper强大灵活的RecyclerAdapter

李泽明
0.93 MB

2积分

3下载

TTScrollRuler可灵活设定的自定义标尺

辛太励
0.03 MB

2积分

1下载

支持物联网的智能风扇速度控制器PCB板

淡淡的爱
0.03 MB

2积分

1下载

SmartBond™ DA14683低功耗蓝牙5.1开发套件Pro - WL-CSP53子板数据手册

2.24 MB

免费

0下载

【幸狐Omni3576边缘计算套件试用体验】Debian系统安装和性能测试

xusiwei1236
1天前

113 阅读

cRIO连接电脑后为什么弹不出来那个设备监视器

jf_58680010
1天前

103 阅读

msp430g2553怎么和4针ssd1306I2C通讯

1天前

123 阅读

IGBT双脉冲测试过程中，第一个脉冲关断时候出现电压抬高的现象，导致炸管了，怎么办

jf_43042536
1天前

486 阅读

PCB Layout 工程师总结！25张图讲透PCB接地设计技巧！

yuu_cool
1天前

375 阅读

推荐专栏
更多

华秋（原“华强聚丰”）：

电子发烧友

华秋开发

华秋电路(原"华强PCB")

华秋商城(原"华强芯城")

华秋智造

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

华秋电路

华秋商城

华秋智造

nextPCB

BOM配单

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

华秋

关于我们

投资关系

新闻动态

加入我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

硬声APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

黄晶晶：huangjingjing@elecfans.com

内容合作（海外）

张迎辉：mikezhang@elecfans.com

供应链服务 PCB/IC/PCBA

江良华：lanhu@huaqiu.com

投资合作

曾海银：zenghaiyin@huaqiu.com

社区合作

刘勇：liuyong@huaqiu.com

关注我们的微信

下载发烧友APP

电子发烧友观察

电子工程师社区

1-32层PCB打样·中小批量

元器件现货·全球代购·SmartBOM

SMT贴片·PCBA加工

PCB Manufacturer

华秋简介

企业动态

联系我们

企业文化

企业宣传片

加入我们

版权所有 © 湖南华秋数字科技有限公司

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）
电子发烧友 （电路图） 湘公网安备43011202000918 工商网监湘ICP备2023018690号-1