趣学贝叶斯定理:贝叶斯定理的先验概率、似然和后验概率(1)

在第7章中,我们讨论了如何利用空间推理去推导贝叶斯定理。现在研究如何将贝叶斯定理当作一种概率工具,对不确定性进行逻辑推理。本章将利用贝叶斯定理来计算和量化在给定数据的情况下,信念有多大的可能性为真。为此,需要使用该定理的三要素——后验概率、似然和先验概率。这3个要素将在这场贝叶斯统计和概率探险之旅中频繁出现。

目录

    • 1. 贝叶斯定理三要素
    • 2. 调查犯罪现场
      • 2.1 求解似然
      • 2.2 计算先验概率
      • 2.3 归一化数据
    • 3. 考虑备择假设
      • 3.1 备择假设的似然
      • 3.2 备择假设的先验概率
      • 3.3 备择假设的后验概率

1. 贝叶斯定理三要素

  1. 我们想量化的是:在所观察到的数据下,自己对信念的坚信程度。在贝叶斯公式中,这个要素的术语是后验概率(posterior probability,简称为“后验”),也就是将通过贝叶斯定理所求出的解。
  2. 似然(likelihood)表示在给定信念的情况下,观察到某一数据的概率,也就是P(数据|信念)。
  3. P(信念): 先验概率(priorprobability,简称为“先验”),它表示我们在看到数据之前的信念强度。似然和先验结合在一起就会形成后验。通常情况下,我们需要使用数据的概率P(数据)对后验归一化,从而使其值介于0和1之间。然而在实践中并不总是需要P(数据),所以这个值没有特殊的名字。
    在这里插入图片描述

2. 调查犯罪现场

假设,一天你下班回家后,发现家里的窗户玻璃碎了,前门开着,你的笔记本计算机也不见了。你的第一反应可能是:“家里被盗了!”但你是如何得出这个结论的?更重要的是,你如何量化这个信念呢?你的第一反应是家里被盗了,所以这里H=被盗。我们需要一个概率来描述家里被盗的可能性有多大,所以根据现有的数据,想要求解的后验是:P(被盗 | 窗户玻璃碎了, 前门开着, 笔记本计算机不见了)

2.1 求解似然

如果家里真的被盗了,同样的数据会被观察到的概率。换句话说,也就是数据与假设的吻合程度:P(窗户玻璃碎了, 前门开着, 笔记本计算机不见了 | 被盗)

我们可以去当地警察局询问盗窃案件犯罪现场的统计数据,或者浏览最近关于盗窃案的新闻报道。这样就可以得到更准确的似然估计:如果被盗,你看到这些数据的概率。

贝叶斯定理的不可思议之处在于,我们既可以用它来衡量信念,也可以用它来处理具有精确概率的大数据集。即使认为似然估计不是一个好的估值,你也可以随时返回去重新计算,看看在不同的假设下这个值是如何变化的。

贝叶斯统计让人们以一种可度量的方式产生不同的信念。因为是以量化的方式处理信念的,所以你可以重做本章所做的一切计算,看看不同的概率是否会对最终的结果产生实质性影响。

2.2 计算先验概率

先验概率非常重要,因为它允许我们使用背景信息对似然进行调整。假设前面描述的场景发生在一个荒岛上,而你是岛上唯一的居民,那么你家几乎不可能被盗(至少是被人类)。换一个场景,如果你家位于犯罪率很高的街区,那么盗窃事件就可能会经常发生。为简单起见,我们将被盗的先验概率设定为:1/10000
如果有不同的或额外的数据,随时可以调整这个概率。

2.3 归一化数据

P(D):所观察到的这些数据发生的概率.
归一化的过程通常涉及到将先验概率与似然函数的乘积除以所有可能结果的概率之和(或积分),以确保后验概率的总和为1。

随着数据发生概率的减小,后验概率会增大
在这个例子中,如果我们考虑到窗户碎了、门开着、笔记本电脑不见了这些数据,如果这些事件的发生概率较小,实际上是暗示了一种情况:即这些事件同时发生的可能性较低。这种情况下,考虑到这些数据,可以得出两种可能性:

  1. 这些事件的发生是一个意外或者自然事件导致的,比如窗户可能是被风吹坏的,门可能是被人忘记关上的,笔记本电脑可能是被误放在别处。

  2. 这些事件的发生是有人为因素导致的,比如入室盗窃。

现在,这里涉及到一个问题是,如果我们假设入室盗窃这种事件的先验概率较低(即我们的先验信念是认为入室盗窃的可能性不大),那么即使考虑到这些数据,我们得到的后验概率可能也不会大到令人信服的程度。换句话说,即使考虑到这些事件,我们仍然更倾向于认为是意外事件造成的可能性更大。

所以,发生的数据概率较小不一定就意味着被盗的后验概率会高,这取决于我们对事件的先验信念以及我们考虑到的具体数据所提供的支持程度。
但有的时候P(D)很难精确计算,我们可以提出一个备择假设,计算它的后验概率,然后将其与原始假设的后验概率进行比较。

3. 考虑备择假设

现在提出另外一个假设,并将它与原来的假设进行比较。新假设包括以下3个事件。(1) 邻居家孩子把棒球打到了窗户上。(2) 你离开家时忘了锁门。(3) 你忘了自己带笔记本计算机去上班并把它落在了办公室。
我们用事件前面的编号来指代这些事件,并将它们统称为H2,所以P(H2)=P(1,2,3)。现在求解这些数据的似然和先验概率。

3.1 备择假设的似然

P(D|H2)=1
如果假设中的所有事件都发生了,那么你肯定会观察到窗户玻璃碎了、前门开着以及笔记本计算机不见了。

3.2 备择假设的先验概率

使用乘法法则计算先验概率:
P ( H 2 ) = 1 2000 ∗ 1 30 ∗ 1 365 = 1 21900000 P(H2)=\frac{1}{2000}*\frac{1}{30}*\frac{1}{365}=\frac{1}{21900000} P(H2)=200013013651=219000001

这3个事件同时发生的先验概率很小。现在我们需要计算出这两个假设的后验概率以进行比较。

3.3 备择假设的后验概率

P 后验 = P ( 似然 ) ∗ P ( 先验 ) = P ( D ∣ H 2 ) ∗ P ( H 2 ) = 1 ∗ 1 21900000 P后验=P(似然)*P(先验)=P(D|H2)*P(H2)=1*\frac{1}{21900000} P后验=P(似然)P(先验)=P(DH2)P(H2)=1219000001

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/491399.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

019 Spring Boot+Vue 电影院会员管理系统(源代码+数据库+文档)

部分代码地址: https://github.com/XinChennn/xc019-cinema 一、系统介绍 cinema项目是一套电影院会员管理系统,使用前后端分离架构开发包含管理员、会员管理、会员卡管理、电影票、消费记录、数据统计等模块 二、所用技术 后端技术栈: …

【泰山派RK3566】智能语音助手(一)移植Kaldi语音转文字

文章目录 移植过程硬件资源下载测试 移植过程 参考我的这篇博客 【RV1126】移植kaldi实时语音识别 硬件 资源下载 链接:https://pan.baidu.com/s/1x1udT5eNzzQHoPOTCQ182A?pwdlief 提取码:lief –来自百度网盘超级会员V6的分享 下载的文件里面有一个…

全志H713/H618方案:调焦电机(相励磁法步进电机)的驱动原理、适配方法

一、篇头 全志H713平台,作为FHD投影的低成本入门方案,其公板上也配齐了许多投影使用的模组,本文即介绍投影仪调焦所用的步进电机,此模组的驱动原理、配制方法、调试方法。因为条件限制,本文采用的是H618香橙派Z3平台&…

Escalate_Linux(4)-利用SUDO实现提权

利用SUDO实现提权 利用用户的sudo授权获得root的shell cat /etc/passwd cat /etc/sudoers 命令没有权限 echo "cat /etc/sudoers" >/tmp/ls chmod 755 /tmp/ls export PATH/tmp:$PATH /home/user5/script 想办法更改user1的口令 echo echo "user1:xiao…

sql-labs第46关(order by盲注脚本)

一、环境 网上有自己找 二、解释 order by 注入我们看他的true和false来进行注入出来 二、实操 让我们用sort 看看源码 最终我们的id是放到order by后面了 如果我们直接用列去排序 ?sortusername/password username: password: 可以看到顺序是不…

每日五道java面试题之spring篇(六)

目录: 第一题 ApplicationContext通常的实现是什么?第二题 什么是Spring的依赖注入?第三题 依赖注入的基本原则第四题 依赖注入有什么优势?第五题 有哪些不同类型的依赖注入实现方式? 第一题 ApplicationContext通常的…

Python及Pycharm专业版下载安装教程(Python 3.11版)附JetBrains学生认证教程

目录 一、Python下载及安装1、Python下载2、Python安装3、验证是否安装成功 二、PyCharm下载及安装1、PyCharm下载2、PyCharm安装3、激活PyCharm 三、JetBrains学生认证 本篇主要介绍Python和PyCharm专业版的下载及安装方式,以及通过两种方式进行JetBrains学生认证。…

HUAWEI Programming Contest 2024(AtCoder Beginner Contest 342)

D - Square Pair 题目大意 给一长为的数组,问有多少对,两者相乘为非负整数完全平方数 解题思路 一个数除以其能整除的最大的完全平方数,看前面有多少个与其余数相同的数,两者乘积满足条件(已经是完全平方数的部分无…

DALL-E 系列 (1-3)

DALL-E 系列 (1-3) 本文主要梳理 DALL-E 系列图像生成模型的整体框架,相关论文中都包含了丰富的训练、优化细节,对这些细节本文不做过多介绍,有兴趣的读者可以阅读原文。注意,在阅读本文之前,最好先了解 VAE、VQVAE、…

解决启动服务报./nginx -s reload nginx: [emerg] unknown directive “错误

重启服务报错 bug: ./nginx -s reload nginx: [emerg] unknown directive "? 原因: 一、可能打开没有关闭 二、刚刚编辑的没成功,乱码了,格式问题,重新配置

一种基于道路分类特性的超快速车道检测算法

摘要: 本文介绍了一种新颖、简单但有效的车道检测公式。 车道检测是自动驾驶和高级驾驶员辅助系统 (ADAS) 的基本组成部分,在实际高阶驾驶辅助应用中,考虑车道保持、转向、限速等相关的控制问题,这种方式通常是通过受限的车辆计算…

Xcode与Swift开发小记

引子 鉴于React Native目前版本在iOS上开发遇到诸多问题,本以为搞RN只需理会Javascript开发,没想到冒出CocoaPod的一堆编译问题。所以横下一条心,决定直接进攻iOS本身。不管你是用React Native,还是用Flutter,iOS下的…