一些AI数学基础

news/2025/1/10 19:38:38/文章来源:https://www.cnblogs.com/jiyuebo/p/18522411

众所周知,在当前机器学习看待数据的很重要一个方式是概率,例如分类问题是建模一个P(Y=C|X)。
在面对离散变量的时候,例如人名这种离散变量。

假设有问题:给一个名字,判断该人是中国哪里人。(或许在现实生活中,该问题是不合理的,一般情况下无法根据人名判断是哪里人)

假设我们有所有省份的人名。我们可以统计不同人名属于某个省份的概率。这个概率可以通过“频率”来计算。
在这里,输入变量“人名”是一个离散型变量。当统计完成后,我们就得到了一个不错的分类模型。

然而,当输入变量是连续型变量的时候,我们无法通过频率来估计概率。连续型变量的概率也没有意义。
例如,从【1,5】这个区间取中任意一个数的概率都是0。因为其样本空间为无穷多。
再用频率去计算就相当于:

$$ \frac{1}{\infty} $$

这个时候,我们就需要对连续性变量的概率进行描述。
于是就引入了概率密度函数这个概念。

举一个例子:
假设一个电子监控设备在每个小时的开始时会被短暂地打开一次,并且无论设备已经使用了多长时间,它都有0.905的概率能够正常工作。

如果我们让随机变量 \(X\) 表示监控设备首次失效的小时数,那么 \(p_X(k) = \prod_{i=1}^{k} ,P_i\) 是 \(k\) 个独立概率的乘积。

。 绘制成图片如下:

如图是K从1-21不同取值下的概率值。如果我们再加上一条曲线:

那么很容易得出,任意一段区间[a,b]内,这些柱状体的面积近似于曲线在该区间的积分

函数 \( f(x) \) 在区间 \([a, b]\) 上的积分表示为:\( \int_{a}^{b} f(x) \, dx \)。

该函数就相当于概率密度函数。通常,我们也将该概率密度函数称为连续变量X的分布。

对于一些常见的概率密度函数,我们也有一些名字例如“正态分布”等。

当我们在面对机器学习任务时候,如果要建模的变量对象是一个连续型变量,有时会假设其服从某些常见分布。例如HMM的语音识别中,隐状态序列S的样本空间为有限的。而状态S对应的观测序列,也就是声音的特征向量是连续型变量。

这时候,如果我们想计算隐状态为Si条件下,某个观测状态的概率。由于观测状态是连续型的特征向量,无法直接统计概率。因此,我们假设已知隐状态S的条件下,观测状态为X的概率服从正态分布。这样就把有限个隐状态对应无数个连续型变量的问题建模为了有限个状态对应有限个不同的正态分布的问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/825873.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VMWare windows xp 安装VMwareTools后重启黑屏问题

VMWare windows xp 安装VMwareTools后重启黑屏问题 使用VMware17安装windowsxp系统后发现不能从VMware安装vmware tools后 在提示网址下载ios后挂载到xp系统上,安装vmware tools后重启,系统黑屏 解决办法: 虚拟机设置->硬件->显示->取消勾选加速3D图形

将网页固定到任务栏

参考:https://jingyan.baidu.com/article/5553fa821b231d25a3393408.html

09.Gateway新一代网关

1.概述 1.1 是什么 1.1.1 官网 https://docs.spring.io/spring-cloud-gateway/reference/ 1.1.2 体系定位 Cloud全家桶中有个很重要的组件就是网关,在1.x版本中都是采用的Zuul网关;但在2.x版本中,zuul的升级一直跳票,SpringCloud最后自己研发了一个网关SpringCloud Gateway…

考研打开(6)

开局(6) 开始时间 2024-11-02 19:44:58 结束时间 2024-11-02 19:48:42

34. 在排序数组中查找元素的第一个位置和最后一个位置

题目 参考了y总讲的这题 789. 数的范围 自己是这样写的; class Solution { public:vector<int> searchRange(vector<int>& nums, int target) {vector<int> result(2, -1);int l = 0, r = nums.size() - 1;while (l < r){int mid = l + (r - l) / 2;…

Vue全家桶–Pinia状态管理

什么是Pinia呢?Pinia和Vuex的区别如何使用Pinia?

2024秋软工实践 旺仔水饺队 原型设计和UML设计

作业所属课程 https://edu.cnblogs.com/campus/fzu/SE2024作业要求 https://edu.cnblogs.com/campus/fzu/SE2024/homework/13297作业的目标 实现项目的原型设计与概要设计团队名称 旺仔水饺102201140 黎曼 102201138 黄俊瑶102201127 罗永辉 102201130 郑哲浩102202144 傅钰 10…

5.树上问题

在宇宙的尽头,时空掌控着时间与空间的无尽流转。过去、现在与未来的区别只是一种固执己见的幻觉,所有的时空都在他的眼中交织成永恒的现在。树上问题 开题顺序: \(ACH\) \(A\) CF600E Lomsat gelral题解\(B\) CF708C Centroids \(C\) CF1706E Qpwoeirut and Vertices题解\(D…

2024-2025-1 20241425《计算机基础与程序设计》第6周学习总结

2024-2025-1 20241425《计算机基础与程序设计》第6周学习总结 作业信息这个作业属于哪个课程 2024-2025-1-计算机基础与程序设计这个作业要求在哪里 https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP/homework/13276这个作业的目标 计算机科学概论(第七版)第7章 《C语…

three.js+vue智慧社区web3d数字孪生三维地图

案例效果截图如下:具体案例场景和功能,详见b站视频: https://www.bilibili.com/video/BV1Bb421E7WL/?vd_source=7d4ec9c9275b9c7d16afe9b4625f636c案例场景逻辑代码:<template><div id="whole"><!-- threejs容器 --><div id="three&q…

网易云课堂视频课件课程下载工具,如何在电脑端下载网易云课堂视频课程课件资料到本地?

一. 安装网易云课堂课程下载器 1.获取学无止下载器 https://www.xuewuzhi.cn/study163_downloader 2.下载安装后,然后点击桌面快捷方式运行即可。 注意:杀毒软件可能会阻止外部exe文件运行,并将其当做成病毒,直接添加信任即可,本软件绝对没有木马病毒。 二. 使用说明 1.学…