统计学习方法笔记

news/2025/1/10 14:45:23/文章来源:https://www.cnblogs.com/zy999/p/18522261

统计学习方法

1.3 统计学习方法的三要素

1.3.1 模型

好,为什么要从1.3开始呢,因为看前面的课,我还没有用到这个软件。

方法=模型+策略+算法

模型有好多个,试试

策略:按照什么样的准则去选取模型

比如说看预测值和真实值有多大,或者损失函数最小等

算法 即怎样去实现去寻找这个模型

决策模型

比如房价预测,我输入x,他就会给出一个房价的预测值

条件概率模型

比如我给一张图片,他就会给出属于猫的概率为多少,属于狗的概率为多少

最后呢,我用argmax函数就可以得出属于哪一类了

1.3.2策略

损失函数和风险函数

首先引入损失函数与风险函数的概念。损失函数度量模型一次预测的好坏,风险函数度量平均意义下模型预测的好坏。

损失函数,有误差平方和,等等

平均损失函数

8ddd256d2928581fadd21c25e007095

好的,上面这个不用,因为我们知道分布,还要机器学习干什么。

我们用这个 经验损失

ef360c3a5c7d2bab8f3f8322237e432

当样本足够大时,这俩就差不多了。第二个就是 损失函数 加起来求平均。L 就是损失函数

在应用中,样本是有限的,所以我们要对平均误差进行矫正。例如正则化什么的,我现在还不会。

经验风险最小化和结构风险最小化

经验风险最小化

ce1da577769c86c5407275fc272f093

当样本数量少,或者易出现过拟合

我们采用结构风险最小化,加一项正则化项

f79b3ba6f59751ce4584fcbba3a35bd

image-20241102165236039

对于概率分布的损失函数有

image-20241102165339349

dfcf750b4634a3073a5bd5df084a2b1

对于这个可以再去别的地方学学

1.3.3算法

算法就是学习模型的具体计算方法。通过算法可以找到最合适的模型

1.4 模型评估与选择

1.4.1 训练与测试误差

训练误差

image-20241102172718002

测试误差

image-20241102172702878

可以理解为考试,在平常的小测试当中,一直做题,做了很多编后,得分很高,但是到了期末考试就,考的很差了,这就是为什么要用到测试误差。

1.4.2过拟合

过拟合:是指模型过于复杂,对训练集训练的太好,反而应用到测试集,效果不怎么理想

image-20241102173830491

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/825809.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

zookeeper的安装与搭建

1、下载zookeeper,并上传到Linux并解压tar -xvf zookeeper-3.5.7.tar.gz -C ../2、修改文件名配置环境变量mv apache-zookeeper-3.5.7-bin zookeeper-3.5.7 vim /etc/profile source /etc/profile3、修改配置文件创建data目录mkdir data创建myid文件touch myid vim myidserver…

Windows Server2022服务器部署RuoYi若依前后端分离

部署准备 虚拟机Windows Server2022 若依前后端分离v3.8.8打包好 jdk1.8 redis5 mysql8.4 iis服务 路由插件 重写插件 1.安装jdk1.8 https://www.azul.com/downloads/#downloads-table-zulu 略 2.安装启动redis5 https://github.com/tporadowski/redis/releases 下载安装默认配…

20222407 2024-2025-1 《网络与系统攻防技术》实验四实验报告

(一)实践目标 恶意代码文件类型标识、脱壳与字符串提取 对提供的rada恶意代码样本,进行文件类型识别,脱壳与字符串提取,以获得rada恶意代码的编写作者,具体操作如下: o使用文件格式和类型识别工具,给出rada恶意代码样本的文件格式、运行平台和加壳工具; o使用超级巡…

状态压缩动态规划

\(3^n\)枚举子集 状压DP中相当重要的技巧(虽然后位有FWT,FMT替代,但不是都能代) for(int i = x; i; i = (i - 1) & x) { // i 就是 x 的子集 }题目 P6622 [省选联考 2020 A/B 卷] 信号传递 看数据范围,\(m \le 23\),且不同分数段增长很慢,表明会有\(O(2^m)\)的做法,…

专题

求区间第k小值 静态 分块 排序 划分树 动态 主席树 平衡树 子树求交 树上颜色问题 统计颜色数量 对于子树\(x\),子树内同种颜色的点只有深度最浅的对子树外有贡献 #3628. 「2021 集训队互测」树上的孤独 贡献上传:对于\(x\),设它同颜色祖先为\(p\),则\(x\)对路径\(p\thicks…

BEVDet4D: Exploit Temporal Cues in Multi-camera 3D Object Detection阅读小结

BEVDet4D提出:提出BEVDet4D范式,将BEVDet从仅空间的3D扩展到时空4D工作空间。BEVDet4D: Exploit Temporal Cues in Multi-camera 3D Object Detection BEVDet4D:在多相机三维目标检测中利用时间线索 摘要背景:单帧数据包含有限信息,限制了基于视觉的多相机3D目标检测性能。…

H7-TOOL的LUA小程序教程第17期:扩展驱动AD7606, ADS1256,MCP3421, 8路继电器和5路DS18B20(2024-11-01)

LUA脚本的好处是用户可以根据自己注册的一批API(当前TOOL已经提供了几百个函数供大家使用),实现各种小程序,不再限制Flash里面已经下载的程序,就跟手机安装APP差不多,所以在H7-TOOL里面被广泛使用,支持在线调试运行,支持离线运行。TOOL的LUA教程争取做到大家可以无痛调…

Print和Println区别

看这样一段程序: // 我的减重程序,lbs是磅的简称package mainimport ("fmt" )func main() {fmt.Println("My weight on the surface of Mars is ")fmt.Println(112 * 0.3783)fmt.Println(" lbs, and I would be ")fmt.Println(19 * 365 / 687)…

【semantic Kernel】Semantic Kernel Tools(VS Code插件)

2023年4月13日,Microsoft发布了一个 Semantic Kernel 的 VS Code 插件,Semantic Kernel Tools,用于进行Semantic Function的开发和调试工作。 Semantic Kernel Tools的安装只需要VS Code即可,不需要额外的其他的环境。 在 VS Code的扩展中搜索 Semantic Kernel Tools ,点击…

java.file文件与IO流.study

但断电后后数据消失。 而IO流就是对数据进行读写 File创建对象: 绝对路径与相对路径: File提供的判断文件类型,获取文件信息功能: File创建和删除文件相关方法: File 遍历文件夹的方法: 代码实现: 文件搜索,实现遍历文件夹下的多级目录:遍历删除文件夹及其里边的…

如何高效驾驭海量任务处理的艺术

场景 在支付业务中,我们需要对接很多渠道,再与渠道交易的过程中,因为网络超时,或者渠道返回订单状态结果未知,这是我们一般都需要主动去调用渠道的查询结果去查询订单的最终结果,如果因为某些异常原因积压了大批量这样的订单,我们怎么如何高速快速的查询这种订单? MySQ…