机器学习(21)---召回率(recall)、精度(precision)和准确率(accuracy)

文章目录

    • 1. 分布不平衡的数据集
    • 2. TP、TN 、FP 、FN
    • 3. 混淆矩阵
    • 4. 各自的计算公式
    • 5. 例题应用


1. 分布不平衡的数据集

 1. 精度(precision)和召回率(recall)是衡量机器学习模型性能的重要指标,特别是数据集分布不平衡的案例中。

 2. 不平衡数据集广泛存在于各种分类问题中,包括二分类和多分类问题。以下是一个简单的二分类问题的例子:假设有100个样本,其中80个样本被标记为类别1,其余20个样本被标记为类别2。这个数据集就是不平衡数据集,类别1和类别2的样本数量之比为4:1。另一个不平衡分类问题出现在当疾病在公众中的发病率很低时的疾病监测。

2. TP、TN 、FP 、FN

 我们检查身体的时候,经常会听到检测结果呈"真阳性"、"假阴性"等说法。

  • “真”、"假"说的是检查结果的对错。”真“意味着检测结果是正确的,"假"意味着检测结果是错误的。
  • “阳性”、"阴性"说的是此次的检查结果。阳性,意味检测出了预定的目标。阴性,意味着没查出预定的目标。
检测结果英文术语含义
真阳性True Positive正确地检测到阳性结果:即检测结果正确,并且结果呈现阳性
假阳性False Positive错误地检测到阳性结果:即检测结果错误,并且结果呈现阳性
真阴性True Negative正确地检测到阴性结果:即检测结果正确,并且结果呈现阴性
假阴性False Negative错误地检测到阴性结果:即检测结果错误,并且结果呈现阴性

3. 混淆矩阵

 1. 混淆矩阵是机器学习领域中用于精度评价的一种标准格式,也被称为误差矩阵。混淆矩阵的每一行代表一个真实的标签,每一列代表一个预测的标签。矩阵的对角线元素表示模型正确分类的实例数,非对角线元素则表示模型错误分类的实例数。

 2.(1)TP+FP+TN+FN:样本总数。(2)TP+FN:实际正样本数。(3)TP+FP:预测结果为正样本的总数,包括预测正确的和错误的。(4)FP+TN:实际负样本数。(5)TN+FN:预测结果为负样本的总数,包括预测正确的和错误的。

在这里插入图片描述

4. 各自的计算公式

 1. 准确率(accuracy)就是在全部预测中,正确预测结果所占的比例。计算公式为:

在这里插入图片描述
 2. 精度(precision)就是在全部阳性预测中,正确预测结果所占的比例。比如,你预报了10次下雨,结果只下了3次,你的预报的精度就是 0.3,因为 TP = 3 , FP = 7。计算公式为:

在这里插入图片描述
 3. 召回率(recall)就是在全部阳性事件中,正确预测结果所占的比例。比如,下了10次雨,结果你只正确预报了2次,你的预报的召回率就是 0.2,因为 TP = 2 , FN = 8 , P = 10。计算公式为:

在这里插入图片描述

5. 例题应用

答案:5、3、0、2、0.625、1.00

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/130972.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《鱿鱼游戏》杀入体验店 SandboxVR未能复制神话

曾经火爆全网的剧集《鱿鱼游戏》这回真的变成游戏了,而且还是能身临其境去玩的那种。 9月底,沉浸式游戏社交公司Sandbox VR与全球知名流媒体Netflix合作,将《鱿鱼游戏》搬入VR体验店,用线下场地VR的方式,重现123木头人…

Android Fragment中使用Arouter跳转到Activity后返回Fragment不回调onActivityResult

Fragment中通过路由跳转到Activity 跳转传递参数 通过Arouter跳转 Postcard postcard ARouter.getInstance().build(RouterConstant.ACTION_TRANSMANAGERACTIVITY1);Bundle bundle new Bundle();bundle.putInt("code", 404);postcard.with(bundle); //设置bundlef…

点云模板匹配

点云模板匹配是一种在点云数据中寻找特定形状或模式的方法。它通常用于计算机视觉和三维图像处理中,可以应用于物体识别、姿态估计、场景分析等任务。点云模板匹配的基本思想是将一个称为模板的小点云形状与输入的大点云进行匹配,以找到最佳的对应关系。…

【Java】什么是API

API (Application Programming Interface,应用程序编程接口) Java中的API 指的就是 JDK 中提供的各种功能的 Java类,这些类将底层封装起来,我们不需要关心这些类是如何实现的,只需要学习这些类如何使用即可,我们可以通过帮助文档…

Maven 依赖管理

Maven 一个核心的特性就是依赖管理。当我们处理多模块的项目(包含成百上千个模块或者子项目),模块间的依赖关系就变得非常复杂,管理也变得很困难。针对此种情形,Maven 提供了一种高度控制的方法。 可传递性依赖发现 …

【运维】一些团队开发相关的软件安装。

gitlab 安装步骤 (1) 下载镜像,并且上传到服务器 https://mirrors.tuna.tsinghua.edu.cn/gitlab-ce/yum/el7/gitlab-ce-16.2.8-ce.0.el7.x86_64.rpm (2)rpm -i gitlab-ce-16.2.8-ce.0.el7.x86_64.rpm (3)安装成功后…

安卓 kotlin-supportFragmentManager报红

如果你继承baseActivity 请查看 是不是继承 AppCompatActivity

L14D6内核模块编译方法

一、内核模块基础代码解析 一个内核模块代码错误仍然会导致的内核崩溃。 GPL协议:开源规定,使用内核一些函数需要 1、单内核的缺点 单内核扩展性差的缺点减小内核镜像文件体积,一定程度上节省内存资源提高开发效率不能彻底解决稳定性低的缺…

地图可视化笔记:kepler.gl 介绍

1 介绍 Kepler.gl 是一个面向大规模地理位置数据集的数据无关、高性能的基于Web的应用程序,用于可视化探索。基于 Mapbox GL 和 deck.gl 构建,kepler.gl 可以实时渲染代表成千上万次行程的数百万个点,并执行空间聚合。 2 效果展示

超强数独解法o.O?带你使用DFS秒杀多解数独√

目录 什么是数独? 数独的解法? 数独DFS算法详解 1. 初始化条件 2. 填入已初始化的数独表 3. 填数独 4. 拓展问题 请问删掉数独中的哪两个数可以使得数独的解最大? 删除的是哪两个数? 最终代码 main函数(如何执行…

Django开发之进阶篇

Django进阶篇 一、Django学习之模板二、Django学习之中间件默认中间件自定义中间件 三、Django学习之ORM定义模型类生成数据库表操作数据库添加查询修改删除 一、Django学习之模板 在 Django 中,模板(Template)是用于生成动态 HTML&#xff…