机器学习数学基础

机器学习基础

    • 1、标量、向量、矩阵、张量
    • 2、概率函数、概率分布、概率密度、分布函数
    • 3、向量的线性相关性
    • 4、最大似然估计
    • 5、正态分布(高斯分布)
    • 6、向量的外积(叉积)
    • 7、向量的内积(点积)
    • 8、超平面(H)



1、标量、向量、矩阵、张量


标量、向量、矩阵和张量是线性代数中不同维度的数学对象,它们之间的区别在于维数和结构:

  • 标量(Scalar):标量是一个数值,只有大小,没有方向。例如物理学中的时间、质量、温度等

  • 向量(Vector):向量也称为欧几里得向量、几何向量、矢量,向量指既有大小又有方向的量。向量可以形象化地表示为带箭头的线段,箭头所指的方向代表向量的方向,线段的长度代表向量的大小。向量有四种表示方式:代数表示(字母加箭头)、几何表示(平行四边形法则)、坐标表示((x,y,z))和矩阵表示([x y z]T

  • 矩阵(Matrix):矩阵是按照方阵排成m行n列的数值集合。简单来说,矩阵是一个二维数组,由行和列组成,每行和每列都是一个向量。矩阵中的每个元素都有自己的行索引和列索引,它可以用来表示线性变换、方程组或数据表

  • 张量(Tensor):张量源于力学,张量是多维数组,目的是把向量、矩阵推向更高的维度。张量是一种泛化的多维数组概念,它可以是任何维度(秩)的,例如向量(矢量)是一阶张量,矩阵是二阶张量,高于二维的称为三阶张量、四阶张量等

总的来说,标量是最简单的数据形式,而向量、矩阵和更高维度的张量则是复杂度逐渐增加的多维数据结构,它们在现代科学和技术的许多领域中都扮演着重要角色

2、概率函数、概率分布、概率密度、分布函数


研究一个随机变量,不只是要看它能取哪些值,更重要的是它取各种值的概率如何!概率函数、概率分布、概率密度、分布函数,都是在描述概率

1)概率函数

概率函数使用函数的形式来表达概率 P i = P ( X = x i ) ( i = 1 , 2 , 3 , . . . ) P_i=P(X=x_i) \quad (i=1,2,3,...) Pi=P(X=xi)(i=1,2,3,...)

例如, P ( X P(X P(X= 1 ) = 1 / 6 1)=1/6 1)=1/6,这个概率函数表示当随机变量取值为1的概率为1/6。概率函数一次只能表示一个随机变量取值的概率

2)概率分布

概率分布是离散型随机变量和每个随机变量对应的概率:

X x 1 x_1 x1 x 2 x_2 x2 x 3 x_3 x3 x n x_n xn
P i P_i Pi P 1 P_1 P1 P 2 P_2 P2 P 3 P_3 P3 P n P_n Pn

这样的列表被叫做离散型随机变量的概率分布。具体就是离散型随机变量的值与这个取值的概率分布列表

对于连续型随机变量,概率分布被叫作概率密度

3)分布函数

对于离散型随机变量,分布函数称为概率分布函数,是指将某一点的概率与该点前面所有概率的累加,又称累积概率函数 F ( X ) = P ( X ≤ x i ) = ∑ 1 i P i F(X)=P(X≤x_i)=\sum_1^iP_i F(X)=P(Xxi)=1iPi

分布函数是一个永不递减的函数,最右边即为最大值1,最左边为最小值0

对于连续型随机变量,分布函数称为概率密度函数,它就是概率密度从负无穷到当前随机变量值的定积分(面积)
F ( X ) = ∫ − ∞ X f ( x ) d x F(X)=\int_{-\infty}^Xf(x)dx F(X)=Xf(x)dx

在这里插入图片描述

如图所示,左图表示 F ( x ) F(x) F(x)是连续型随机变量的概率密度,右图表示 f ( x ) f(x) f(x)是连续型随机变量的概率密度函数,它们之间的关系是:概率密度函数是概率密度的导函数

需要注意的是,概率密度函数在某点取值的几何意义表示概率密度函数在该点的变化率(导数),而不是概率值

3、向量的线性相关性


所有分量为实数的n维向量构成的集合, 称为一个n维向量空间,向量空间又称线性空间

对于n维向量 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am,如果存在不全为0的数使得
k 1 a 1 + k 2 a 2 + . . . + k m a m = 0 k_1a_1+k_2a_2+...+k_ma_m=0 k1a1+k2a2+...+kmam=0

则称向量组 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am是线性相关的,否则,称向量组 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am线性无关

4、最大似然估计


最大似然估计的原理详解及推导见文章:传送门

5、正态分布(高斯分布)


正态分布(高斯分布)的介绍详见文章:传送门

6、向量的外积(叉积)


向量的叉积(叉乘),也叫向量的外积、向量积。对于两个向量 a ⃗ = ( x 1 , y 1 , z 1 ) \vec a=(x_1,y_1,z_1) a

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/444251.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++关键词auto详解

顾得泉:个人主页 个人专栏:《Linux操作系统》 《C从入门到精通》 《LeedCode刷题》 键盘敲烂,年薪百万! 一、小思考 随着我们对于C的不断学习,遇到的程序越来越复杂,程序中用到的类型也越来越复杂…

通用CI/CD软件平台TeamCity全新发布v2023.11——增强Git托管平台的集成

TeamCity是一个通用的 CI/CD 软件平台,可以实现灵活的工作流、协作和开发做法。我们的解决方案将帮助在您的 DevOps 流程中成功实现持续集成、持续交付和持续部署。 TeamCity 2023.11正式版下载 TeamCity 2023.11 带来了矩阵构建和构建缓存等多项备受期待的功能&a…

【Linux取经路】进程控制——进程等待

文章目录 一、进程创建1.1 初识 fork 函数1.2 fork 函数返回值1.3 写时拷贝1.4 fork 的常规用法1.5 fork 调用失败的原因1.6 创建一批进程 二、进程终止2.1 进程退出场景2.2 strerror函数2.3 errno全局变量2.4 程序异常2.5 进程常见退出方法2.6 exit 函数2.7 _exit 函数和 exit…

miniReact<一>

一、工程化配置 1.1 目录结构 1.1.1 Multi-repo VS Mono-repo Multi-repo 每个库有自己独立的仓库,逻辑清晰,协同管理复杂 Mono-repo 很方便管理不同独立的库的生命周期,会有更高的操作复杂度 项目有很多包,同时管理多个不同的…

MySQL原理(四)索引(3)索引失效与索引区分度

一、索引失效: 首先未使用索引列作为查询条件索引是肯定会生效的,还有其他的情况,索引列做为了查询条件也失效了: ALTER TABLE staffs ADD INDEX idx_staffs_nameAgePos(NAME, age, pos); 1、select 语句、order by语句&#xf…

如何快捷查看电脑配置

目录 1.左下角搜索输入cmd打开控制台,输入命令**systeminfo**然后回车2.左下角搜索系统信息然后点开 👍 点赞,你的认可是我创作的动力! ⭐️ 收藏,你的青睐是我努力的方向! ✏️ 评论,你的意见…

pnpm : 无法加载文件 D:\tool\nvm\nvm\node_global\pnpm.ps1,因为在此系统上禁止运行脚本

你们好,我是金金金。 场景 新创建的项目,在vscode编辑器终端输入 pnpm i,显示报错如上 解决 在终端输入get-ExecutionPolicy(查看执行策略/权限) 输出Restricted(受限的) 终端再次输入Set-ExecutionPolicy -Scope CurrentUser命令给用户赋予…

神经网络的一些常规概念

epoch:是指所有样本数据在神经网络训练一次(单次epoch(全部训练样本/batchsize)/iteration1)或者(1个epochiteration数 batchsize数) batch-size:顾名思义就是批次大小,也就是一次训练选取的样…

贪吃蛇/链表实现(C/C++)

本篇使用C语言实现贪吃蛇小游戏,我们将其分为了三个大部分,第一个部分游戏开始GameStart,游戏运行GameRun,以及游戏结束GameRun。对于整体游戏主要思想是基于链表实现,但若仅仅只有C语言的知识还不够,我们还…

数据结构_单链表题-2.1

一. 反转单链表 将一个单链表反过来。 个人思路(一团浆糊大错特错) 反转嘛,变最后为起点,依次反转过来就行了。 1)找到最后三个链表结点,分别保存下来,以最后一个为首地址。 2)最…

【51单片机系列】应用设计——8路抢答器的设计

51单片机应用——8路抢答器设计 文章设计文件及代码:资源链接。 文章目录 要求:设计思路软件设计仿真结果 要求: (1) 按下”开始“按键后才开始抢答,且抢答允许指示灯亮; (2&…

Orion-14B-Chat-RAG本地部署的解决方案

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…