机器学习：ROC曲线笔记-编程知识

机器学习：ROC曲线笔记

news/2025/3/9 10:47:44/文章来源:https://blog.csdn.net/Ningbo_JiaYT/article/details/136104223

ROC曲线（Receiver Operating Characteristic Curve）是一种用于评估二分类模型性能的图形化工具，主要用于展示在不同阈值（Threshold）下模型的真阳性率（True Positive Rate，TPR）和假阳性率（False Positive Rate，FPR）之间的关系。

ROC曲线最早起源于二战期间，用于分析雷达信号检测敌方飞机的能力，随后逐渐扩展到其他领域，特别是医学诊断。自20世纪末，ROC已被广泛应用于机器学习，通过改变分类阈值，展示模型将正类与负类区分开来的能力，以此找到最佳的模型参数和决策阈值。

目录

基本概念

1.混淆矩阵（Confusion Matrix）

1.1 组成类别

1.2 评估指标

2. AUC（Area Under the Curve）

3.约登指数（Youden's index）

曲线组成

基本概念

1.混淆矩阵（Confusion Matrix）

也称为误差矩阵，用于展示实际类别与模型预测类别之间的关系，以此评估有监督学习中分类模型的性能。混淆矩阵对于二分类和多分类问题都适用，在流行病学研究中，它被应用于评估筛检试验的真实性。

预测	实际
预测	正例	负例
正例	真阳性（TP）	假阳性（FP）
负例	假阴性（FN）	真阴性（TN）

（ROC曲线是多个混淆矩阵结果的组合）

1.1 组成类别

真阳性（True Positive，TP）：模型正确地将正类预测为正类的数量。

假阴性（False Negative，FN）：模型错误地将正类预测为负类的数量。

假阳性（False Positive，FP）：模型错误地将负类预测为正类的数量。

真阴性（True Negative，TN）：模型正确地将负类预测为负类的数量。

1.2 评估指标

通过混淆矩阵，我们可以计算出多种评估指标，从不同角度评估模型性能：

准确率（Accuracy）：模型正确预测的总体比例，计算公式为： $Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$

精确度（Precision）：模型预测为正类中实际为正类的比例，计算公式为： $Precision = \frac{TP}{TP + FP}$

召回率（Recall）或灵敏度（Sensitivity）：实际为正类中模型预测为正类的比例，计算公式为： $Recall = \frac{TP}{TP + FN}$

特异度（Specificity）：实际为负类中模型预测为负类的比例，计算公式为： $Specificity = \frac{TN}{TN + FP}$

F1分数（F1 Score）：精确度和召回率的调和平均数，计算公式为： $F1 Score = \frac{2 \times (Precision \times Recall)}{Precision + Recall}$

2. AUC（Area Under the Curve）

曲线下面积，用于综合评价模型在各种不同阈值下的表现。AUC的取值范围在0~1，常用于量化比较不同分类器的性能，AUC值越高，表示模型性能越好。

AUC = 1.0 ：完美分类器，模型没有任何的分类错误；

AUC > 0.5 ：模型具有将正类和负类区分开来的能力，且性能超过了随机猜测；

AUC < 0.5 ：模型的表现还不如随机猜测，表明模型存在严重问题。

3.约登指数（Youden's index）

也称为正确指数，常用于确定最佳阈值，即约登指数最大的时候，模型分类能力最佳。计算方式为： $约登指数 = 灵敏度 + 特异度 − 1$

曲线组成

1.真阳性率：也称为灵敏度、召回率或命中率，作为纵坐标；

2.假阳性率：是在所有实际负例中，被错误地判断为正例的比例，作为横坐标；

3.阈值：是界定正类和负类的分界线。通过调整阈值，模型预测正类的标准更高或更低，从而影响到TPR和FPR的值。ROC曲线上的每一个点都对应一个特定的决策阈值。

4.AUC：ROC曲线与坐标轴对角线组成的面积。

曲线绘制：在一个坐标图上，将FPR作为横轴（X轴），TPR作为纵轴（Y轴）。对于一个二分类模型，通过改变决策阈值，我们可以得到一系列的（FPR, TPR）点，将这些点连线就形成了ROC曲线。理想情况下，最好的预测模型的ROC曲线会尽可能地靠近左上角，意味着具有更高的TPR和更低的FPR。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/467774.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

02 动力云客之登陆界面

02 动力云客之登陆界面

1. 前端登录界面需求样式: 1. 自定义登录页面装配到main.js src下新建一个文件夹view, view下新建一个Vue Component , 名为LoginView.vue , 并选择options API Composition API用于复杂页面. 生成的LoginView.vue文件 <script> export default {//组件的名字nam…

阅读更多...

如何一键启动、停止或重启运行在服务器内的幻兽帕鲁游戏服务进程？

如何一键启动、停止或重启运行在服务器内的幻兽帕鲁游戏服务进程？

如果你是用腾讯云轻量应用服务器一键部署的幻兽帕鲁服务器，那么可以在面板一键启动、停止或重启运行在服务器内的幻兽帕鲁游戏服务进程（注意并非对服务器整机进行操作），无需手动在服务器内部运行命令。详细教程地址：h…

阅读更多...

C++笔记1：操纵符输入输出

C++笔记1：操纵符输入输出

C操纵符用来控制输出控制，一是输出的形式，二是控制补白的数量和位置。本文记录一下，在一些笔试的ACM模式可能有用。其中1-4节的部分是关于格式化输入输出操作，5-6节的部分是关于未格式化输入输出操作。 1. 控制布尔值的格式一般…

阅读更多...

双场板功率GaN HEMT电容模型以精确模拟开关行为

双场板功率GaN HEMT电容模型以精确模拟开关行为

标题：Capacitance Modeling in Dual Field-Plate Power GaN HEMT for Accurate Switching Behavior（TED.16年） 摘要本文提出了一种基于表面电位的紧凑模型，用于模拟具有栅极和源极场板（FP）结构的AlGaN/G…

阅读更多...

低资源学习与知识图谱：构建与应用

低资源学习与知识图谱：构建与应用

目录前言1 低资源学习方法1.1 数据增强1.2 特征增强1.3 模型增强 2 低资源知识图谱构建与推理2.1 元关系学习2.2 对抗学习2.3 零样本关系抽取2.4 零样本学习与迁移学习2.5 零样本学习与辅助信息 3 基于知识图谱的低资源学习应用3.1 零样本图像分类3.2 知识增强的零样本学习3.3…

阅读更多...

CSS 评分器星星效果

CSS 评分器星星效果

<template><view class="rating"><input value="5" name="rating" id="star5" type="radio"><label for="star5"></label><input val…

阅读更多...

2024年智能算法优化PID参数，ITAE、ISE、ITSE、IAE四种适应度函数随意切换，附MATLAB代码...

2024年智能算法优化PID参数，ITAE、ISE、ITSE、IAE四种适应度函数随意切换，附MATLAB代码...

PID 参数整定就是确定比例系数（Kp ）、积分系数（Ki）和微分系数（Kd ）的过程，以便使 PID 控制器能够在系统中实现稳定、快速、准确的响应。本期的主题采用四种2024年的智能优化算法优化PID的三个…

阅读更多...

【医学知识图谱自动补全关系抽取】生成模型 + 医学知识图谱 = 发现三元组隐藏的关系实体对

【医学知识图谱自动补全关系抽取】生成模型 + 医学知识图谱 = 发现三元组隐藏的关系实体对

生成模型医学知识图谱发现三元组新关系实体对提出背景问题：如何自动发现并生成医疗领域中未被标注的实体关系三元组？CRVAE模型提出背景论文：https://dl.acm.org/doi/pdf/10.1145/3219819.3220010 以条件关系变分自编码器（…

阅读更多...

Django学习全纪录：创建第一个Django项目，如何使用Django开发⼀个web应用

Django学习全纪录：创建第一个Django项目，如何使用Django开发⼀个web应用

导言在上一篇文章里，我们对Django的开发环境进行了学习以及搭建，在上一篇文章里，同时也为大家介绍了安装、验证、修改默认镜像源等知识。在这一篇文章里，我们就正式开始我们的Django开发之旅，创建我们的第一个项目，做一些较为简单且必需的前置工作。如何创建Django项目…

阅读更多...

【Linux】Kali Linux 系统安装详细教程（虚拟机）

【Linux】Kali Linux 系统安装详细教程（虚拟机）

目录 1.1 Kali linux简介 1.2 Kali Linux工具 1.3 VMware workstation和ESXi的区别二、安装步骤一、Kali概述 1.1 Kali linux简介 Kali Linux是基于Debian的Linux发行版， 设计用于数字取证操作系统。每一季度更新一次。由Offensive Security Ltd维护和资助。最…

阅读更多...

RocksDB：高性能键值存储引擎初探

RocksDB：高性能键值存储引擎初探

在现代的分布式系统和大数据应用中，一个高效、可靠的存储引擎是不可或缺的。RocksDB，由Facebook于2012年开发并随后开源，正是为了满足这类需求而诞生的。它是一个持久化的键值存储系统，特别适合在闪存（Flash&#xff0…

阅读更多...

【Python网络编程之TCP三次握手】

【Python网络编程之TCP三次握手】

🚀 作者 ：“码上有前” 🚀 文章简介 ：Python开发技术 🚀 欢迎小伙伴们点赞👍、收藏⭐、留言💬 Python网络编程之[TCP三次握手] 代码见资源，效果图如下一、实验要求二、协议原理2.…

阅读更多...

推荐文章

最新文章