0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个从数据中估计参数的基础机器学习问题

5RJg_mcuworld 来源:未知 作者:李倩 2018-04-27 11:30 次阅读

假如你有一个硬币。你把它投掷 3 次,出现了 3 次正面。下一次投掷硬币正面朝上的概率是多少? 这是一个从数据中估计参数的基础机器学习问题。在这种情况下,我们要从数据 D 中估算出正面朝上 h 的概率。

最大似然估计

一种方法是找到能最大化观测数据的似然函数(即 P(D;h))的参数 h 的值。在这里,我们用「;」来表示 h 是一个关于概率分布 P 的参数,意味着参数 h 定义了分布 P,但是分布 P 只是说明了观测数据 D 成立的可能性有多大。

这是被称为「最大似然估计」的最常用的参数估计方法。通过该方法,我们估计出 h=1.0。

但是直觉告诉我们,这是不可能的。对于大多数的硬币来说,还是存在反面朝上的结果的可能性,因此我们通常希望得到像 h=0.5 这样的结果。

先验和后验

如何将这种直觉数学化地表述出来呢?我们可以定义一个观测数据和参数的联合概率:p(D, h) = p(D|h)p(h)。我们定义一个先验分布 p(h) 来表示在观测前关于 h 应该是什么值的直觉,以及在给定参数 h 的情况下的条件概率 p(D|h)。

如何利用现有的数据 D 估计参数 h 呢?我们需要得到后验分布 p(h|D),但是目前只有分布 P(D|h) 和 p(h)。这时候,你需要贝叶斯公式来帮忙!

贝叶斯公式:P(h|D)=P(D|h)*P(h)/P(D)

但是,这里的分母是一个问题:

一般来说,计算这个积分是不可能的。对于这个投硬币的例子来说,如果使用非常特殊的共轭先验分布,就可以绕过这个问题。

最大后验估计

但实际上,我们可以抛开归一化常数 P(D) 以更巧妙的方式讨论 p(h|D)。也就是说归一化常数不改变分布的相对大小,我们可以在不做积分的情况下找到模式:

这就是人们所熟知的最大后验估计(MAP)。有很多种方法可以算出变量 h 的确切值,例如:使用共轭梯度下降法。

贝叶斯参数估计

有了最大后验估计,可以通过先验分布来引入我们的直觉,并且忽略归一化积分,从而得到后验分布模式下的关于 h 的点估计。

但是如果我们试着用近似方法求积分呢?如果按通常的独立同分布假设,我们可以利用这个事实:未来可能出现的数据样本值 x 条件独立于给定参数 h 时的观测值 D。

这并非使用与后验概率 p(h|D) 模式相应的参数 h 的单一值来计算 P(x|h),而是一个更加「严格」的方法,它让我们考虑到所有可能的 h 的后验值。这种方法被称为贝叶斯参数估计。

注意,存在两个关于概率分布的重要任务:

推断:给定已知参数的联合分布,通过其它变量的边缘概率和条件概率估计一个变量子集上的概率分布。

参数估计:从数据中估计某个概率分布的未知参数

贝叶斯参数估计将这两项任务构造成了「同一枚硬币的两面」:

估计在一组变量上定义的概率分布的参数,就是推断一个由原始变量和参数构成的元分布。

当然,实际上要做到这一点,需要计算困难的积分,我们将不得不用类似于「马尔可夫链蒙特卡洛算法」或者变分推断等方法取近似。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8373

    浏览量

    132391
  • 贝叶斯公式
    +关注

    关注

    0

    文章

    3

    浏览量

    1710

原文标题:什么是最大似然估计、最大后验估计以及贝叶斯参数估计?

文章出处:【微信号:mcuworld,微信公众号:嵌入式资讯精选】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    25机器学习面试题,你都会吗?

    问题都没有给出明确的答案,但都有定的提示。读者也可以在留言中尝试。许多数据科学家主要是从个数据从业者的角度来研究机器
    发表于 09-29 09:39

    什么是机器学习? 机器学习基础入门

    的指导下,这个过程数据开始。也就是说,我们嵌入式系统产生的大量数据机器学习开发过程的第步是
    发表于 06-21 11:06

    文读懂人工智能、机器学习和深度学习三者的不同点

    机器学习机器学习是人工智能的种途径或子集,它强调“学习”而不是计算机程序。一台机器使用复杂的算
    发表于 09-25 15:08 816次阅读

    零到python机器学习大神的7步骤

    有许多python机器学习资源在线免费提供,哪开始?如何进行?零到python机器学习大神只
    发表于 11-15 12:29 1.3w次阅读

    机器学习几种常见回归函数的概念学习

    回归问题的条件/前提: 1) 收集的数据 2) 假设的模型,即函数,这个函数里含有未知的参数,通过学习,可以
    发表于 12-15 11:20 4724次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>中</b>几种常见回归函数的概念<b class='flag-5'>学习</b>

    谈谈四无法学校或各种线上平台学习到的机器学习技巧

    机器学习教育过程通常倾向于深入学习机器学习算法,教导我们技术层面上理解他们的运作方式。
    的头像 发表于 06-27 11:04 3976次阅读

    机器学习的几种数据偏差

    机器学习数据偏差是种错误,其中数据集的某些元素比其他元素具有更大的权重和或表示。有偏见的
    的头像 发表于 01-05 17:54 2884次阅读

    机器学习好用的函数的原因是什么

    (1)机器学习中经典的“支持向量机(SVM)”的主要提出者弗拉基米尔·万普尼克(Vladimir Vapnik),在其著作《统计学习理论的本质》这样定义
    的头像 发表于 11-02 16:15 757次阅读

    机器学习数据挖掘的对比与区别

    机器学习数据挖掘的对比与区别  机器学习数据挖掘是当前互联网行业中最热门的领域之
    的头像 发表于 08-17 16:11 1468次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    机器学习算法总结 机器学习算法是什么?机器学习算法优缺点?
    的头像 发表于 08-17 16:11 1824次阅读

    python数据挖掘与机器学习

    用的数据挖掘和机器学习工具。 数据挖掘 数据挖掘是指
    的头像 发表于 08-17 16:29 1280次阅读

    数据挖掘和机器学习有什么关系

    数据挖掘和机器学习有什么关系 数据挖掘和机器学习是两
    的头像 发表于 08-17 16:29 2424次阅读

    机器学习数据挖掘的区别 机器学习数据挖掘的关系

    视为同概念。在这篇文章,我们将讨论机器学习数据挖掘之间的区别以及它们之间的关系。 机器
    的头像 发表于 08-17 16:30 2003次阅读

    机器学习theta是什么?机器学习tpe是什么?

    下theta。在机器学习,theta通常表示模型的参数。在回归问题中,theta可能表示线性回归的斜率和截距;在分类问题中,theta
    的头像 发表于 08-17 16:30 1871次阅读

    机器学习数据分析的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为种强大的工具,
    的头像 发表于 07-02 11:22 542次阅读