【机器学习入门】18种常见的机器学习算法数学公式及解析

机器学习算法基础原理:

https://codeknight.blog.csdn.net/article/details/135632808icon-default.png?t=N7T8https://codeknight.blog.csdn.net/article/details/135632808

https://codeknight.blog.csdn.net/article/details/135639843icon-default.png?t=N7T8https://codeknight.blog.csdn.net/article/details/135639843

机器学习算法模型应用:

(3)【Python数据分析进阶】Machine-Learning模型与算法应用-线性回归与逻辑回归-CSDN博客文章浏览阅读1.5k次,点赞21次,收藏18次。sklearn,全称scikit-learn,是一个基于Python的开源机器学习工具包。它提供了各种分类、回归和聚类算法,包括但不限于支持向量机、随机森林、梯度提升、k均值和DBSCAN等。此外,它还包含了许多常用的机器学习算法、预处理技术、模型选择和评估工具等,可以方便地进行数据挖掘。这个库通过集成NumPy, SciPy和Matplotlib等Python数值计算的库实现了高效的算法应用。可以说,sklearn是机器学习中一个非常常用且功能强大的Python第三方模块。https://blog.csdn.net/qq_51701007/article/details/135693621?spm=1001.2014.3001.5501

目录

1、一元一次线性回归公式与解析

2、多元一次线性回归公式与解析

3、多项式线性回归公式与解析

4、VIF(Variance Inflation Factor,方差膨胀因子)公式与解析

5、岭回归(Ridge Regression)公式与解析

6、Lasso回归(Least Absolute Shrinkage and Selection Operator)公式与解析

7、逻辑回归(Logistic Regression)公式与解释

8、决策树算法公式与解析

9、随机森林算法公式与解析

​​​​10、Adaboost(自适应增强)算法公式与解析

11、XGBoost算法公式与解析

12、Gradient Boosting算法公式与解析

13、KNN算法的公式与解析

14、支持向量机(SVM)算法公式与解析

15、贝叶斯算法公式与解析

16、K-Means聚类算法公式与解析

16、层次聚类算法公式与解析

17、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法公式与解析

18、PCA(Principal Component Analysis)算法公式与解析


1、一元一次线性回归公式与解析

                y = ax + b,其中a为斜率,b为截距。

解析:

  1. 首先,我们需要收集数据点(x, y)。
  2. 然后,计算所有数据点的x和y的平均值。
  3. 接下来,计算斜率a,即数据点之间的x差的平均值与y差的平均值之比。
  4. 最后,计算截距b,即y轴上的截距,即y轴上所有数据点的平均值减去斜率a乘以x轴上所有数据点的平均值。

2、多元一次线性回归公式与解析

3、多项式线性回归公式与解析

4、VIF(Variance Inflation Factor,方差膨胀因子)公式与解析

VIF(Variance Inflation Factor,方差膨胀因子)是一种衡量多重共线性的统计指标。在回归分析中,如果一个自变量与多个其他自变量高度相关,那么这个自变量就存在多重共线性问题。

VIF的计算公式为:

VIF = 1 / (1 - R²)

其中,R²表示自变量与其他自变量的相关系数平方和。

5、岭回归(Ridge Regression)公式与解析

岭回归(Ridge Regression)是一种线性回归的改进方法,它通过在损失函数中添加一个L2正则项(权重系数的平方和)来防止过拟合。岭回归的公式如下:

6、Lasso回归(Least Absolute Shrinkage and Selection Operator)公式与解析

Lasso回归(Least Absolute Shrinkage and Selection Operator)是一种线性回归的正则化方法,它通过在损失函数中添加一个L1正则项(权重系数的绝对值之和)来控制模型的复杂度。Lasso回归的公式如下:

7、逻辑回归(Logistic Regression)公式与解释

逻辑回归(Logistic Regression)是一种分类算法,主要用于解决二分类问题。其公式为:

8、决策树算法公式与解析

是一种集成学习方法,它通过构建多个决策树并将它们的预测结果进行投票来得到最终的预测结果。随机森林算法的主要公式如下:

9、随机森林算法公式与解析

是一种集成学习方法,它通过构建多个决策树并将它们的预测结果进行投票来得到最终的预测结果。随机森林算法的主要公式如下:

10、Adaboost(自适应增强)算法公式与解析

即自适应增强算法,是一种集成学习的算法。其核心思想是通过对训练数据集进行重新加权,使得前一个基础分类器分错的样本在后一个基础分类器中得到更多的关注,同时减小前一个分类器分对的样本在后一个分类器中的关注。此外,该算法会赋予每个弱分类器一个权重系数,这个权重系数体现了这个弱分类器的性能好坏。

11、XGBoost算法公式与解析

12、Gradient Boosting算法公式与解析

13、KNN算法的公式与解析

14、支持向量机(SVM)算法公式与解析

支持向量机(SVM)算法的核心思想是找到一个超平面,使得两个类别之间的间隔最大化。这个超平面被称为最优分割超平面。支持向量机算法的公式如下:

15、贝叶斯算法公式与解析

是一种基于概率的分类算法,它通过计算先验概率和后验概率来进行分类。贝叶斯公式是该算法的核心公式,其表达式如下:

16、K-Means聚类算法公式与解析

是一种无监督学习方法,其基本思想是通过迭代计算,将数据集划分为K个簇。算法的主要步骤如下:

  1. 初始化:选择K个初始质心(可以随机选择数据集中的数据点作为初始质心)。
  2. 分配:将每个数据点分配到距离其最近的质心所在的簇。
  3. 更新:重新计算每个簇的质心,即簇内所有数据点的均值。
  4. 重复步骤2和3,直到质心不再发生变化或达到最大迭代次数。

K-Means算法的LaTeX公式表示如下:

16、层次聚类算法公式与解析

主要包括两种:凝聚式(Agglomerative)和分裂式(Divisive)。这里以凝聚式为例,介绍其公式及注解。

  1. 最小距离法(Single-linkage):计算簇内各点之间的距离,取最小值作为簇间的距离。

  2. 最大距离法(Complete-linkage):计算簇内各点之间的距离,取最大值作为簇间的距离。

  3. 平均距离法(Average-linkage):计算簇内各点之间的距离,取平均值作为簇间的距离。

  4. 中心距离法(Ward's method):计算簇内各点之间的距离,加上簇间的距离的平方和的倒数作为簇间的距离。

层次聚类算法的公式表示如下:

17、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法公式与解析

是一种基于密度的聚类算法,它可以找到任意形状的簇,并且能够识别噪声点。DBSCAN算法的主要公式如下:

 18、PCA(Principal Component Analysis)算法公式与解析

是一种常用的无监督学习算法,用于精简高维数据。它的主要思想是通过线性变换将原始数据投影到新的坐标系中,使得新坐标系的基向量尽可能接近于原始数据的协方差矩阵的特征向量。

PCA算法的基本步骤如下:

  1. 计算原始数据的均值和协方差矩阵。
  2. 对协方差矩阵进行特征值分解,得到特征值和特征向量。
  3. 选择前k个最大的特征值对应的特征向量,构成一个投影矩阵。
  4. 将原始数据乘以投影矩阵,得到降维后的数据。

以下是PCA算法公式及注解:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/438138.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机设计大赛 基于图像识别的跌倒检测算法

前言 🔥 优质竞赛项目系列,今天要分享的是 基于图像识别的跌倒检测算法 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/…

detectron2的read_image方法

在看代码的时候,看到一行注释:use PIL, to be consistent with evaluation 说是用PIL方法加载,却又看见了BGR这种表述,后面的调用也都是cv2格式: 那我就要看下这里面是怎么实现的了,找到了read_image函数&…

使用取色器更改主题及颜色时取色器消失问题

问题分析&#xff1a;使用取色器时更改主题颜色时&#xff0c;出现了还没有选择颜色&#xff0c;取色器就消失的现象 1、更改主题颜色实现&#xff1a; <el-form><el-form-item label"主题颜色"><el-color-pickerchange"setColor"v-model…

MySQL(下)

四、事务 一、概念 对数据库的一次执行中有多条sql语句执行。这多条sql在一次执行中&#xff0c;要么都成功执行&#xff0c;要么都不执行。保证了数据完整性。MySQL中只有innodb引擎支持事务。 二、特性 事务是必须满足 4 个条件&#xff08;ACID&#xff09;&#x…

C++中的智能指针

目录 背景 裸指针 智能指针 原理 智能指针 auto_ptr unique_ptr 1. unique_ptr禁止拷贝构造(copy constructor)和赋值运算() 1.1 C提供了标准库函数move() 1.2.如果unique_ptr是一个临时右值 2. unique_ptr可用于数组 shared_ptr 环状引用问题 weak_ptr 注意&#xf…

【思科】 GRE VPN 的实验配置

【思科】GRE VPN 的实验配置 前言报文格式 实验需求配置拓扑GRE配置步骤R1基础配置GRE 配置 ISP_R2基础配置 R3基础配置GRE 配置 PCPC1PC2 抓包检查OSPF建立GRE隧道建立 配置文档 前言 VPN &#xff1a;&#xff08;Virtual Private Network&#xff09;&#xff0c;即“虚拟专…

【C++进阶】STL容器--list使用迭代器问题分析

目录 前言 1. list的基本使用 1.1 list构造函数 1.2 list迭代器 1.3 list capacity 1.4 list元素访问 1.5 list 修改操作 insert erase swap resize clear 2. list失效迭代器问题 3. list使用算法库函数问题 总结 前言 list&#xff08;链表&#xff09;在C中非常重要…

Qt开源版 vs 商业版 详细比较!!!!

简单整理Qt开源版与商业版有哪些差别&#xff0c;仅供参考。 简单对比 开源版商业版许可证大部分采用对商业使用不友好的LGPLv3具备商业许可证保护代码专有许可证相关大部分模块使用LGPLv3和部分模块使用GPL组成仅第三方开源组件使用Qt的其他许可证Qt模块功能支持支持技术支持…

探秘Photoshop | 一站式了解所有相关信息

Photoshop是迄今为止世界上最强大的图像编辑软件&#xff0c;它已成为许多涉及图像处理的行业标准。软件技术一天行千里&#xff0c; Photoshop也在不断更新&#xff0c;从1990年开始发布&#xff0c; photoshop1.0到最新的 2018Photoshop... 几乎每隔一年&#xff0c;Photosho…

python爬虫demo——爬取历史平均房价

简单爬取历史房价 需求 爬取的网站汇聚数据的城市房价 https://fangjia.gotohui.com/ 功能 选择城市 https://fangjia.gotohui.com/fjdata-3 需要爬取年份的数据&#xff0c;等等 https://fangjia.gotohui.com/years/3/2018/ 使用bs4模块 使用bs4模块快速定义需要爬取的…

css圆形弹出菜单按钮效果

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><title>圆形弹出菜单按钮</title><link rel&qu…

PC电脑端的小程序顶部自定义标题失效的原因

windows客户端不被支持:navigationStyle:custom!! navigationStylestringdefault导航栏样式&#xff0c;仅支持以下值&#xff1a; default 默认样式 custom 自定义导航栏&#xff0c;只保留右上角胶囊按钮。iOS/Android 微信客户端 7.0.0&#xff0c;Windows 微信客户端不支…