机器学习(3)

目录

3-1线性回归

3-2最小二乘解

3-3多元线性回归

3-4广义线性模型

3-5对率回归

3-6对率回归求解

3-7线性判别分析        

3-8LDA的多类推广

3-9多分类学习基本思路

3-10类别不平衡


3-1线性回归

线性模型为什么重要?

人类在考虑问题时,通常很难直接思考非线性的问题

线性模型:试图学得一个通过属性的线性组合来进行预测的函数

优点:简单,基本,可理解性好

线性回归

“线性回归”试图学得一个线性模型以尽可能地预测实值输出标记。

均方误差有非常好的几何意义,它对应了常用的欧几里得距离或简称“欧式距离”。基于均方误差最小化来进行模型求解的方法为“最小二乘法”。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧氏距离之和最小。

3-2最小二乘解

求解w和b使E(w,b)最小化的过程,称为线性回归模型的最小二乘“参数估计”

偏导的物理意义表示的是变化率(理解为什么令导数为0)

3-3多元线性回归

我们把包括两个或两个以上自变量的回归称为多元线性回归。

同样令其为零可得最优解得闭式解,但由于涉及逆矩阵的计算,比单变量情形要复杂一些,需要做简单的讨论。

若存在逆矩阵,直接求解

若不存在,加上不同的归纳偏好,即引入正则化项

3-4广义线性模型

线性模型虽然简单,却有着丰富的变化

广义线性模型,线性模型经过操作来逼近y,其中函数g()被称为“联系函数”

3-5对率回归

考虑“二分类任务”,而线性回归模型产生的预测值是实值,于是我们需要将实值转换成0/1值。

最理想的是“单位阶跃函数”,但性质不好,我们需要找到替代函数,“对数几率函数”,简称
“对率函数”。

“对数几率回归”虽然名字是回归,但它实际却是一种分类学习方法

3-6对率回归求解

求解思路

3-7线性判别分析        

如何用线性模型直接做分类?线性判别分析简称LDA

同类尽可能近,异类尽可能远。

将样例投影到一条直线,可看作降维技术。

LDA的目标(最大化广义瑞丽商)

求解过程

3-8LDA的多类推广

LDA推广到多类

3-9多分类学习基本思路

现实中常遇到多分类学习任务。有些二分类学习方法可直接推广到多分类。但在更多情形下,我们是基于一些基本策略,利用二分类学习器来解决多分类问题。

多分类学习的基本思路是“拆分法”。最典型的拆分策略有三种:“一对一”(简称“OvO”),“一对其余”(简称OvR),“多对多(简称MvM)"

3-10类别不平衡

前面介绍的分类学习方法都有一个共同的假设,即不同类别的训练样本数目相当。但若不同类别的训练样例差距过大,则会对学习过程造成很大的影响。

也不是所有的类别不平衡都要处理,只有当丢掉的小类价值很高时才进行处理。(eg:信用卡检测)

过采样:增加小类的采样,在中间插值

欠采样:减少大类的采样,丢弃部分数据

阈值移动:修改阈值

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/704461.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cocos Creator 3.8.x 透明带滚动功能的容器

ScrollView 是一种带滚动功能的容器 1、删除ScrollView下Sprite组件的SpriteFrame 2、ScrollView下scrollBar的Sprite组件的Color设为:FFFFFF00 3、ScrollView下view的Graphics组件的FillColor设为:FFFFFF00

文档可视化+表单引擎,让数据交互更流畅!

hello,大家好,我是徐小夕。之前和大家分享了很多可视化,零代码和前端工程化的最佳实践,今天继续分享一下最近开发的文档引擎 Nocode/WEP 的最新更新。 往期精彩 零代码AI的阶段性复盘文档引擎AI可视化打造下一代文档编辑器爆肝100…

用docker命令行操作远程的Dockerd daemon服务

本地安装 Dockerd 服务太耗本机磁盘空间了,共用已有的Dockerd服务能够节省一部分空间 修改 Dockerd 服务启动文件,增加TCP监听方式 Dockerd 服务默认监听方式为 Unix Domain Socket ,只允许本机连接,想要能够远程连接&#xff0…

selenium发展史

Selenium Core 2004 年,Thoughtworks 的工程师 Jason Huggins 正在负责一个 Web 应用的测试工作,由于这个项目需要频繁回归,这导致他不得不每天做着重复且低效的工作。为了解决这个困境,Jason 开发了一个运行在 JavaScript 沙箱中…

43k Star!推荐一款功能强大的开源笔记软件!

程序员的公众号:源1024,获取更多资料,无加密无套路! 最近整理了一份大厂面试资料《史上最全大厂面试题》,Springboot、微服务、算法、数据结构、Zookeeper、Mybatis、Dubbo、linux、Kafka、Elasticsearch、数据库等等 …

2024软件测试必问的常见面试题1000问!

01、您所熟悉的测试用例设计方法都有哪些?请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。 答:有黑盒和白盒两种测试种类,黑盒有等价类划分法,边界分析法,因果图法和错误猜测法。白盒有逻辑覆盖法&…

每天Get一个小技巧:用DolphinScheduler实现隔几天调度

转载自tuoluzhe8521 这篇小短文将教会你如何使用Apache DolphinScheduler实现隔几天调度,有此需求的小伙伴学起来! 1 场景分析 DolphinScheduler定时器模块-定时调度时每3秒|每3分钟|每3天这种定时,不能够跨分钟,跨小时&#x…

Unity | Spine动画动态加载

一、准备工作 Spine插件及基本知识可查看这篇文章:Unity | Spine动画记录-CSDN博客 二、Spine资源动态加载 1.官方说明 官方文档指出不建议这种操作。但spine-unity API允许在运行时从SkeletonDataAsset或甚至直接从三个导出的资产实例化SkeletonAnimation和Skel…

第189题|幂级数的展开的常规方法(二)|武忠祥老师每日一题

解题思路:将函数展开成幂级数有两种方法:一种是直接法(这种一般比较麻烦),一种是拆解成现有展开式展开(这种的特征一般是能因式分解)。 第一步: 这里看到 ln(1-x-2x^2) 将里面的式…

使用Selenium破解滑动验证码的原理及解决思路

1、获取页面元素信息: 使用Selenium打开目标网页,并通过相关方法获取滑块、背景图等元素的位置和属性信息。可以使用Selenium提供的定位方法(如xpath、CSS选择器等)来找到这些元素。 可以使用find_element_by_xpath或find_elemen…

ctfshow SSRF 351-358

做题前,需要先学习关于ssrf漏洞的相关知识 小注意: 当使用 file_get_contents() 函数访问远程 URL 时,它会尝试获取该 URL 指向的资源的内容,并将内容以字符串的形式返回。 如果 b.php 文件是一个 PHP 文件,它包含的内容取决于该 PHP 文件…

【LInux】<基础IO> 文件操作 | 文件描述符 | 重定向

👦个人主页:Weraphael ✍🏻作者简介:目前正在学习c和算法 ✈️专栏:Linux 🐋 希望大家多多支持,咱一起进步!😁 如果文章有啥瑕疵,希望大佬指点一二 如果文章对…