0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于贝叶斯概念进行形式化的建模和推理

新机器视觉 来源:威尔·库尔特 2023-10-18 10:51 次阅读

来源 | 《趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学》 作者 | [美] 威尔·库尔特(Will Kurt) 译者 |王凌云

本章将概述贝叶斯推理。所谓贝叶斯推理,是指我们在观察到一些数据后,更新自己对这个世界的信念的过程。我们将通过一个场景来探讨如何将日常经验映射到贝叶斯推理中。

好消息是,在拿起本书之前,你就已经是一个贝叶斯主义者了!贝叶斯统计其实与人们如何自然地利用数据创造新的信念、如何进行日常问题的推理密切相关。坏消息是,将这种自然的思维过程分解为严谨的数学过程很难。

在统计学中,我们通过使用特定的计算和模型来更准确地量化概率。不过,本章不会使用任何数学计算或模型,我们只需要熟悉基本概念,并利用直觉来确定概率。我们才会精确地计算概率。在本书的剩余部分,你将学习如何使用严格的数学方法对本章涉及的概念进行形式化的建模和推理。

1 对奇怪经历的推理

一天晚上,你突然被窗外的一道亮光惊醒。你从床上跳起来,向外望去,发现天空中有一个碟形的庞然大物。你从来都不相信会遇见外星人,但现在你完全被外面的景象迷惑了。你发现自己在想:这难道是不明飞行物(unidentified flying object,UFO)吗?!

贝叶斯推理就是这样一种思维过程:在遇到一种情况时,你会做出概率假设,然后根据这些假设更新你对这个世界的信念。在UFO这个情景中,你已经经历了一个完整的贝叶斯分析过程,因为你:

(1) 观察到了数据;

(2) 做出了一个假设;

(3) 根据观察到的数据更新了自己的信念。

这种推理往往发生得太快,以至于你没有时间分析自己的思维过程。你在没有任何质疑的情况下建立了一个新的信念:之前你不相信UFO的存在,在事件发生之后你更新了自己的信念,你认为自己看到了UFO。

本章主要关注信念的产生及其构建过程,这样你就可以更规范地研究它。此外,后面的章节还将研究如何量化这个过程。

让我们从观察数据开始,依次分析这个推理过程的每一个步骤。

(1)观察数据

将信念建立在数据上,是贝叶斯推理的一个关键组成部分。在对场景得出任何结论之前(比如说你声称自己看到了UFO),你需要理解所观察到的数据。在这个例子中,数据是:

窗外的一道亮光;

一个碟形物体在空中盘旋。

根据经验,你会把窗外的景象描述为“令人惊讶的场景”,用概率的术语表示,可以将它写为:

a4e1fa6a-6cd0-11ee-939d-92fbcf53809c.png(窗外出现亮光, 天空中有碟形物体) a4ee3e6a-6cd0-11ee-939d-92fbcf53809c.png 很小

其中a4e1fa6a-6cd0-11ee-939d-92fbcf53809c.png 表示概率,括号内列出的是两条数据。你可以将这个等式理解为“窗外出现亮光且天空中有碟形物体的概率很小”。在概率论中,当要表示多个事件的联合概率(combined probability)时,用逗号分隔事件。请注意,这两条数据并不包含任何关于UFO的具体内容,它只由你的观察结果组成——这一点在后面会很重要。

也可以考查单个事件的概率,并将其写为:

a4e1fa6a-6cd0-11ee-939d-92fbcf53809c.png(下雨) a4ee3e6a-6cd0-11ee-939d-92fbcf53809c.png 很可能

这个等式的意思是,“下雨的概率比较大”。

对刚才提到的UFO场景,我们要确定的是两个事件一起发生的概率。这与两个事件单独发生的概率完全不同。例如,单独出现亮光很容易,一辆路过的汽车就会发出亮光,所以就出现亮光这个事件而言,它发生的概率要远远大于它和碟形物体同时出现的概率(不过碟形物体单独出现也同样让人惊讶)。

如何确定这个概率呢?现在,我们使用的是直觉,也就是自我感觉到的这件事发生的可能性。第2章将介绍如何得出概率的精确数值。

(2)先验信念和条件概率

早晨醒来,煮杯咖啡喝,然后开车去上班。在这个过程中,你不需要做很多分析,这是因为你对这个世界如何运转有着先验信念(prior belief)。先验信念是我们根据一生的经验(也就是观察到的数据)建立起来的信念集合。你相信太阳会升起,因为自你出生以来太阳每天都会升起(当然,在阴雨天,你看不见太阳升起)。如果没有先验信念,我们每天晚上睡觉时都会害怕明天的太阳可能不会升起。

先验信念表示,在看到窗外有明亮灯光的同时看到一个碟形物体,这在地球上很少见。但如果你生活在一个遥远的星球上,那里有大量的飞碟且经常有星际访客,那么在天空中同时看到亮光和碟形物体的概率就会大很多。

在公式中,先验信念写在数据后面并用“|”与数据隔开,就像下面这样:

a4e1fa6a-6cd0-11ee-939d-92fbcf53809c.png(窗外出现亮光,天空中有碟形物体 | 地球上的经验) a4ee3e6a-6cd0-11ee-939d-92fbcf53809c.png 很小

这个等式可以理解为:“根据我们在地球上的经验,在天空中同时看到亮光和碟形物体的概率很小。”

这个概率结果被称为条件概率(conditional probability),因为计算某一个事件发生的概率时,以另一个事件的存在为条件。在这种情况下,我们会根据经验来调整观察到的事件的概率。

正如用a4e1fa6a-6cd0-11ee-939d-92fbcf53809c.png 表示概率一样,我们通常用另外的变量来表示事件和条件,这样更简洁。如果你不太熟悉等式,一开始可能觉得它们显得过于简洁。但过一段时间你就会发现,简洁的变量名既有助于提高可读性,也有助于你了解等式如何推广到更大的问题类别上。我们将把所有的数据赋给一个变量 a53351a8-6cd0-11ee-939d-92fbcf53809c.png

a5427318-6cd0-11ee-939d-92fbcf53809c.png 窗外出现亮光,天空中有碟形物体

所以从现在开始,当提到这组数据集的概率时,我们会直接用a549f124-6cd0-11ee-939d-92fbcf53809c.png 来表示。

同样,我们会用变量a54efef8-6cd0-11ee-939d-92fbcf53809c.png 来表示先验信念,像下面这样:

a55c487e-6cd0-11ee-939d-92fbcf53809c.png 地球上的经验

现在可以将上文中等式的左边写为a56b171e-6cd0-11ee-939d-92fbcf53809c.png。这样写更为简单且意思保持不变。

以多重信念为条件

如果有一个以上的变量会显著影响概率,那么我们可以添加一个以上的先验信念。假设今天是特定节日,根据经验,你知道在这天放烟花很常见。根据你在地球上的经验和今天是特殊的日子,在天空中看到亮光的概率不是完全没有,甚至那个碟形物体也可能与某个烟花表演有关。因此,你可以将这个等式改写为:

a4e1fa6a-6cd0-11ee-939d-92fbcf53809c.png(窗外出现亮光, 天空中有碟形物体 | 特定节日, 地球上的经验) a4ee3e6a-6cd0-11ee-939d-92fbcf53809c.png 小

对比这两种情况可以发现,条件概率从“很小”变成了“小”。

在实践中假设存在先验信念

在统计学中,通常不会明确地为所有的现有经验附加条件,因为它是可以假设的。出于这个原因,在本书中,我们不会在这种情况下单独增加变量。然而在贝叶斯分析中,我们必须记住,我们对这个世界的理解总是以自己在这个世界上的经验为条件的。本章的其余部分会保留“地球上的经验”这个变量以提醒这一点。

(3)形成假设

到目前为止,我们已经有了数据a53351a8-6cd0-11ee-939d-92fbcf53809c.png(看到了一道亮光和一个碟形物体)和先验信念 a54efef8-6cd0-11ee-939d-92fbcf53809c.png。为了解释所看到的情况,我们需要形成某种假设(hypothesis),即形成一个关于世界如何运作的模型,从而做出预测。假设可以有多种形式,我们对这个世界的所有基本信念都可以是假设。

如果相信地球自转,那么你就可以预测太阳会在某个时间升起和落下。

如果认为你最喜欢的棒球队是最好的,那么你就可以预测他们会比其他球队赢得更多。

假设也可以更正式、更复杂。

科学家可能会假设某种治疗方法能减缓癌症恶化。

金融领域的定量分析师会构建市场行为模型。

深度神经网络可以预测哪些图像展示的是动物,哪些图像展示的是植物。

所有这些例子都是假设,因为它们都包含对这个世界的某种理解,并利用这种理解来预测世界将如何运作。当提到贝叶斯统计中的假设时,通常关注的是它对我们观察到的数据的预测能力。

当看到数据并认为自己看到了UFO时,你就在形成一个假设。UFO的假设很可能是基于你以前看过的电影和电视节目。将第一个假设定义为:

a5906f78-6cd0-11ee-939d-92fbcf53809c.png 在我家的后院里有一个UFO!

但这个假设预测的又是什么呢?如果将问题倒过来想,我们可能会问:“如果在你家的后院里有一个UFO,那么你预期会看到什么呢?”你可能会回答:“亮光和碟形物体。”因为a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png 预测了数据 a53351a8-6cd0-11ee-939d-92fbcf53809c.png,所以当我们在给定的假设下观察到数据时,数据的概率就会增加。这样的结果可以规范地表示为:

a5b347be-6cd0-11ee-939d-92fbcf53809c.png

这个式子的意思是:“如果相信这是UFO并根据经验,在天空中看到亮光和碟形物体的概率要远远大于只看到亮光和碟形物体而无法解释的概率(这里用两个大于号a5be440c-6cd0-11ee-939d-92fbcf53809c.png 表示远远大于)。”这里用概率的语言证明了我们的假设可以解释数据。

(4)在日常语言中发现假设

很容易看出,日常语言和概率之间有着某种关系。例如,说某事“令人惊讶”,其实就等于说,根据我们的经验,它发生的概率比较小;而说某件事“很合理”,其实是说,基于经验,它发生的概率比较大。一旦指出,这种关系似乎就变得很明显了,但概率推理的关键在于仔细思考如何解释数据、形成假设并改变你自己的信念,即使面对的是一个普通的日常场景。如果没有假设a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png,那么你就会感到疑惑,因为你无法解释所观察到的数据。

2 收集更多的数据以更新信念

现在你有了数据和假设,然而由于之前你一直对UFO事件持怀疑态度,因此这个假设看起来还是很离谱。为了进一步提高知识水平以得出更可靠的结论,你需要收集更多的数据。这是统计推理的下一个步骤,也是直觉思维的下一个步骤。

为了收集更多的数据,需要进行更多的观察。具体到UFO这个场景,你需要向窗外看看还能观察到什么。

当去看外面的亮光时,你注意到这个区域还有更多的灯光,还看到那个巨大的碟形物体用电线吊着,并留意到一个摄像人员。你听到一声巨响,有人喊了一声“停”。

你很有可能会瞬间改变对这个场景中所发生事情的看法。之前,你的推断是自己可能看到了一个UFO,现在有了一些新数据,你意识到这看起来更像是有人在附近拍电影。

在这一思维过程中,你的大脑又一次瞬间完成了一次复杂的贝叶斯分析!为了更仔细地分析这一事件,下面来分解这一思维过程。

最初,你的假设是:

a5906f78-6cd0-11ee-939d-92fbcf53809c.png 有UFO着陆!

根据你的经验,这个假设单独发生的可能性非常小:

a5d33f24-6cd0-11ee-939d-92fbcf53809c.png 非常小

这是在现有数据下,你能想到的唯一可能的解释。但是,当观察到更多的数据后,你立刻意识到还有一个可能的假设——附近有人正在拍摄电影:

a5db394a-6cd0-11ee-939d-92fbcf53809c.png 有人正在窗外拍摄电影

这个假设单独发生的概率从直觉上来说也很小(除非你碰巧住在电影制片厂附近):

a5e57874-6cd0-11ee-939d-92fbcf53809c.png 很小

请注意,这里将a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png 的概率设为“非常小”,并将 a6093aa2-6cd0-11ee-939d-92fbcf53809c.png 的概率设为“很小”。这与我们的直觉相符。假设在没有任何数据的情况下有人走过来询问:“你认为哪一种可能性更大——是UFO夜间出现在你家附近,还是刚好有电影在你家附近拍摄?”你会回答拍摄电影的可能性要比出现UFO的可能性更大。

当改变信念时,我们需要用一种方法将新得到的数据考虑进去。

3 对比假设

最开始,尽管不太相信,但你接受了出现UFO的假设,因为除此之外你想不出任何其他解释。然而现在出现了另一种可能的解释——正在拍摄电影,由此产生了备择假设(alternative hypothesis)。思考备择假设的过程,就是利用你所掌握的数据对多种假设进行比较的过程。

当看到电线、电影摄制组和额外的灯光时,你所掌握的数据就发生了变化。更新后的数据是:

a53351a8-6cd0-11ee-939d-92fbcf53809c.png更新后 a4ee3e6a-6cd0-11ee-939d-92fbcf53809c.png 亮光, 碟形物体, 电线, 摄制组, 其他灯光等

在观察到这些额外的数据后,你改变了对所发生事情的结论。下面将这个过程分解成贝叶斯推理过程。第一种假设a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png 给了一种解释数据的方法,让你不再困惑;然而随着观察的进一步深入,a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png 已经不能很恰当地解释数据了。用概率的方法表示就是:

a641c458-6cd0-11ee-939d-92fbcf53809c.png更新后 a64c4a2c-6cd0-11ee-939d-92fbcf53809c.png 非常小

现在你有了一种新的假设a6093aa2-6cd0-11ee-939d-92fbcf53809c.png,它可以更恰当地解释数据,用概率的方法表示就是:

a641c458-6cd0-11ee-939d-92fbcf53809c.png更新后 a6719eee-6cd0-11ee-939d-92fbcf53809c.png更新后 a68017ee-6cd0-11ee-939d-92fbcf53809c.png

这里的关键是,要理解我们是在比较这些假设对观测数据的解释程度。当说“在第二种假设中,数据的出现概率要远远大于第一种假设”时,我们的意思是,第二种假设可以更恰当地解释所观察到的数据。由此,我们就触及了贝叶斯分析的真正核心:检验信念的标准是它们解释世界的能力。我们说一种信念要比另一种信念更准确,是因为它能更恰当地解释我们所观察到的世界。

数学上用这两种概率的比值来表达这个想法:

a686c206-6cd0-11ee-939d-92fbcf53809c.jpg

当这个比值是一个很大的数时,比如1000,它意味着“a6093aa2-6cd0-11ee-939d-92fbcf53809c.png 对数据的解释要比 a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png 恰当1000倍”。因为 a6093aa2-6cd0-11ee-939d-92fbcf53809c.png 对数据的解释要比 a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png 好很多,所以我们将信念从 a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png 改变为 a6093aa2-6cd0-11ee-939d-92fbcf53809c.png。这正是当你改变对所观察情况的看法时所发生的事情。现在你之所以相信自己看到的是窗外正在拍摄电影,是因为它更能解释你所观察到的所有数据。

4 数据影响信念,信念不应该影响数据

最后值得强调的一点是,所有这些示例中唯一不变的是数据。你的假设可以改变,你在这个世界上的经验a54efef8-6cd0-11ee-939d-92fbcf53809c.png 也可以与别人不同,但是数据 a53351a8-6cd0-11ee-939d-92fbcf53809c.png 则是所有人共享的。

思考下面这两个公式。第一个已经在本章中多次使用:

a6e96d70-6cd0-11ee-939d-92fbcf53809c.png

它可以理解为“根据给定的假设和我的经验所得出的数据概率”,或者更直白地说,“我的信念对所观察到的数据解释得如何”。

但在日常思维中,有一种反过来的情况,那就是:

a6f73b4e-6cd0-11ee-939d-92fbcf53809c.png

它可以理解为“根据数据和在这个世界上的经验,我的信念的概率”,或者“我观察到的情况对我的信念的支持程度”。

在第一种情况下,我们会根据所收集到的数据和对世界的观察来改变自己的信念,从而更恰当地描述这个世界。在第二种情况下,我们收集数据来支持自己当前的信念。贝叶斯思维就是改变你的想法,更新你对世界的理解。我们观察到的数据都是真实的,所以我们的信念终归需要转变,直到与数据一致。

在生活中,你的信念也应该是始终可变的。

当摄制组收工时,你注意到所有的面包车上都有同一个徽章图案。你隐约听到有人说:“嗯,这应该骗过了所有看到这一场景的人……真是好主意。”

有了这些新数据后,你的信念可能会再次改变!

5 小结

下面来回顾一下本章所介绍的内容。你根据现有的经验a54efef8-6cd0-11ee-939d-92fbcf53809c.png 形成了最初的信念。而观察到的数据 a53351a8-6cd0-11ee-939d-92fbcf53809c.png,要么与你的经验一致,即 a7131080-6cd0-11ee-939d-92fbcf53809c.png 很大;要么让你感到惊讶,即 a7131080-6cd0-11ee-939d-92fbcf53809c.png 很小。为了理解这个世界,你信赖根据观察所形成的信念,或者说假设 a71b93f4-6cd0-11ee-939d-92fbcf53809c.png。很多时候,一种新的假设可以解释让你感到惊讶的数据,用概率的语言表示就是 a724ed1e-6cd0-11ee-939d-92fbcf53809c.png。当收集到新的数据或产生新的想法时,你可以形成更多的假设,如 a5a17f3e-6cd0-11ee-939d-92fbcf53809c.pnga6093aa2-6cd0-11ee-939d-92fbcf53809c.pnga758523a-6cd0-11ee-939d-92fbcf53809c.png 等。当一种新的假设要比旧的假设更能解释收集到的数据时,即当出现下面这种情况时,你会改变自己的信念。

a76970e2-6cd0-11ee-939d-92fbcf53809c.png 较大数值

最后,你应该更关注那些改变你的信念的数据,而不是确保数据支持你的信念,即a7706be0-6cd0-11ee-939d-92fbcf53809c.png 的值。

有了这些基础,就可以往其中添加数值了。你将用数学方法模拟自己的信念,从而精确地决定你应该如何以及何时改变自己的信念。

6 练习

试着回答以下问题,检验一下你对贝叶斯推理的理解程度。

(1) 使用本章介绍的数学符号,将下列表述改写为数学表达式:

下雨的概率较小;

在阴天,下雨的概率较大;

下雨时,你带伞的概率要远远大于通常情况下带伞的概率。

(2) 使用本章介绍的方法,将你在下述场景中观察到的数据整理为数学表达式,然后提出假设来解释这些数据。

你下班回到家,看到正门是开着的且侧窗坏了。走进门后,你很快发现自己的笔记本计算机不见了。

(3) 下述场景在第2题的基础上增加了一些数据。使用本章介绍的数学符号演示这些新信息如何改变你的信念,并提出第2个假设来解释这些数据。

邻居家的孩子跑过来向你道歉,他不小心将石头扔到你家的窗户上,打碎了玻璃。同时他还说,他看见了你的笔记本计算机,因为不想让它被偷,所以他打开正门将它拿回了家。现在你的笔记本计算机在他家,很安全。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 贝叶斯
    +关注

    关注

    0

    文章

    77

    浏览量

    12565

原文标题:强大的贝叶斯定理,看完后忍不住惊叹数学太重要了!

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    形式化方法的工程

    验证工作作为典型的形式化方法的工程案例,应用了形式化方法的需求分析、建模与验证,由此验证了形式化方法的可行性与有效性。
    的头像 发表于 03-24 11:01 1481次阅读
    <b class='flag-5'>形式化</b>方法的工程<b class='flag-5'>化</b>

    有用labview做网络进行故障诊断的朋友吗?

    有用labview做网络进行故障诊断的朋友吗?我虽然有些labview基础,但对
    发表于 03-10 19:26

    朴素法的优缺点

    朴素法(1) 之 基础概念
    发表于 08-05 11:32

    对朴素算法的理解

    我对朴素算法的理解
    发表于 05-15 14:13

    全概率公式与公式分享

    全概率公式与公式(一)
    发表于 06-08 15:14

    使用PyMC3包实现线性回归

    1、如何使用PyMC3包实现线性回归  PyMC3(现在简称为PyMC)是一个
    发表于 10-08 15:59

    基于网络的软件项目风险评估模型

    针对软件项目面临失败风险的问题,提出一种新的软件风险评估模型,采用网络推理风险发生的概率,用模糊语言评估风险后果与损失的方法。实践证明,通过应用基于
    发表于 04-10 09:35 24次下载

    网络精确推理算法的研究

    网络是以概率理论为基础的不确定知识表示模型,网络
    发表于 08-15 09:34 38次下载

    网络分析

    网络
    发表于 03-31 10:40 2次下载

    IP网络拥塞链路推理

    针对CLINK算法在路由改变时拥塞链路推理性能下降的问题,建立一种变结构离散动态网模型,通过引入马尔可夫性及时齐性假设简化该模型,并基于简化模型提出一种IP网络拥塞链路
    发表于 01-16 18:46 0次下载

    如何理解公式

    前言 大家经常看到的公式(Bayes)是写成如下图的形式,通常以P(A|B),P(B|A)的形式表示,虽然数学上看着简单,那到底A,B
    发表于 02-02 14:13 3915次阅读
    如何理解<b class='flag-5'>贝</b><b class='flag-5'>叶</b><b class='flag-5'>斯</b>公式

    统计的一个实践案例让你更快的对算法有更多的了解

    为了大家可以对算法有更多的了解,为大家整理过一篇关于
    的头像 发表于 07-16 17:15 1.5w次阅读

    基于网络和数据挖掘的航班延误预测方法

    数据的网络分析模型,得到不同条件下航班延误情况的概率分布;以动态网络( Dynami
    发表于 04-26 15:30 3次下载
    基于<b class='flag-5'>贝</b><b class='flag-5'>叶</b><b class='flag-5'>斯</b>网络和数据挖掘的航班延误预测方法

    朴素分类 朴素算法的优点

    朴素方法是在算法的基础上进行了相应的简化
    的头像 发表于 10-02 17:14 9324次阅读

    形式化方法基本原理初探

    形式化方法是基于严格的数学基础,通过采用数学逻辑证明来对计算机软硬件系统进行建模、规约、分析、推理和验证,是用于保证计算机软硬件系统正确性以及安全性的一种重要方法。
    的头像 发表于 01-30 16:42 1196次阅读
    <b class='flag-5'>形式化</b>方法基本原理初探