深度学习指标| 置信区间、Dice、IOU、MIOU、Kappa

深度学习部分指标介绍

  • 置信区间
  • 混淆矩阵
  • Dice
  • IOU和MIOU
  • Kappa

置信区间

95%CI指标
读论文的时候,常会看到一个“95%CI”的评价指标。

其中CI指的是统计学中的置信区间(Confidence interval,CI)。在统计学中,一个概率样本的置信区间,是对产生这个样本的总体的参数分布中的某一个未知参数值,以区间形式给出的估计。

这样解释有点抽象,直观理解可以为“用样本估计总体平均值,给出总体均值最有可能落的区域”。

置信区间怎么得到?
下面用一个例子理解来最直观理解一下“置信区间”得到的过程。

一个10人的班级,这是每个人考的分数。

学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10
60708090667288916575

在已经知道全部学生成绩的时候,可以很好推出平均值为75.7。

但是现实生活中,通常需要计算的总体数量很大,我们是没办法在上帝视角下知道总体所有的值,例如需要知道全市所有学生的平均成绩,这个时候我们只能采用抽样的方式来估计。

从这10个人里,取出3个人作为抽样标本并计算其平均值,取5组。

  • 学生1、2、5:65.3
  • 学生3、4、8:87
  • 学生4、6、7:83.3
  • 学生7、8、9:81.3
  • 学生3、6、9:72.3

每次抽样取平均值实际上就是在对全部学生平均成绩的一次点估计,点估计估计一个值,笃定了这个值是精确。
但是这五次点估计,在不知道总体学生成绩的时候,我们也依旧不知道那个是最接近真实平均值的。

于是就有区间估计,区间估计估计了一个范围,认为这个区间内至少有一个值使得待定参数最接近于真实值。通常可以用点估计算出来的数据加上一个变动幅度形成一个区间。
但是就算估计出来了区间,也有可能这个区间未必包含或者很靠近真实平均值,依旧还是不知道那个是最好的区间。

于是又有了置信区间来知道这个区间范围包含真实值的可信度,来评估区间的好坏。

根据大数定理和中心极限定律,样本均值M服从正态分布:
M ∼ N ( μ , σ 2 n ) M\sim N(\mu,\frac{{\sigma}^2}{n}) MN(μ,nσ2)

μ \mu μ为中心, σ \sigma σ是总体分布的标准差,面积为0.95的区间就是置信区间。95%置信区间可以理解为对总体抽样1000次,然后发现95%抽样均值分布在这个区间中。
在这里插入图片描述
但实际情况中我们是不知道真实的 μ \mu μ是多少的,可以用抽样样本均值替代。

混淆矩阵

因为后面说Dice、IOU和MIOU要用到混淆矩阵的一些概念,所以放在这里方便理解。

预测为正类别预测为负类别
实际为正类别True Positive (TP)False Negative (FN)
实际为负类别False Positive (FP)True Negative (TN)

混淆矩阵中TP、TN、FP、FN:
TP(True Positives):预测为正类别,并且预测对了
TN(True Negatives):预测为负类别,而且预测对了
FP(False Positives):预测为正类别,但是预测错了
FN(False Negatives):预测为负类别,但是预测错了

Dice

Dice系数又叫做骰子系数,作用在于计算两个集合相似度,取值范围在[0,1]。

对于集合X和集合Y的Dice系数计算公式可以写成:
D i c e ( X , Y ) = 2 ∗ ∣ X ∩ Y ∣ ∣ X ∣ + ∣ Y ∣ Dice(X,Y)=\frac{2*|X\cap Y|}{|X|+|Y|} Dice(X,Y)=X+Y2XY

对于混淆矩阵中,Dice系数的表述可以看作是预测为正类的集合与真实正类集合两者之间的相似度。

Dice系数计算公式可以写成:
D i c e = 2 ∗ T P ( T P + F N ) + ( T P + F P ) Dice=\frac{2*TP}{(TP+FN)+(TP+FP)} Dice=(TP+FN)+(TP+FP)2TP

在这里插入图片描述

IOU和MIOU

IOU(Intersection over Union)是交并比,MIOU(Mean Intersection over Union)指平均交并比,也称为平均IOU。两个都是用于衡量语义分割任务中预测结果与真实标签之间的相似度。

图像语义分割是像素级别上的分类,每个像素都被赋予一个特定的类别标签。可以把每个类别的预测结果和真是标签分别视为两个二值图像,IOU交并比是计算两个之间重叠区域与它们的并集之间的比例,来衡量相似度。

I O U = ∣ X ∩ Y ∣ ∣ X ∪ Y ∣ IOU=\frac{|X\cap Y|}{|X\cup Y|} IOU=XYXY

在这里插入图片描述

IOU=某类别的交集区域 / 某类别的并集区域
MIOU = 所有类别的IoU之和 / 类别总数

例如一张图片可以分为两个标签分别是背景和人,则MIOU=(IOU人+IOU背景)/2

Kappa

Kappa系数是一个用于一致性检验的指标,可用于衡量分类的效果,取值范围在[-1,1]。

一致性通常指模型的预测结果和实际分类结果是否一致。

Kappa系数的计算公式可以写成:
K a p p a = p 0 − p e 1 − p e Kappa=\frac{p_0-p_e}{1-p_e} Kappa=1pep0pe

其中 p 0 p_0 p0是总体分类精度,每一类正确分类的样本数量之和除以总样本数。
设每一类的真实样本个数分别为 a 1 、 a 2 . . . a_1、a_2... a1a2...,而预测出来的每一类的样本个数分别为 b 1 、 b 2 . . . b_1、b_2... b1b2...,则 p e = a 1 × b 1 + a 2 × b 2 . . . n × n p_e=\frac{a_1×b_1+a_2×b_2...}{n×n} pe=n×na1×b1+a2×b2...

虽然说Kappa系数取值范围在[-1,1],但是通常落在[0,1],根据结果通常可以分成五个级别的一致性:

  • 极低的一致性(slight):0.0~0.20
  • 一般的一致性(fair):0.21~0.40
  • 中等的一致性(moderate):0.41~0.60
  • 高度的一致性(substantial):0.61~0.80
  • 几乎完全一致(almost perfect): 0.81~1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/540066.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安卓APP反证书抓包(基于frida和r0capture[总结各种坑])

前言 本文是针对APP校验证书,用frida配合r0capture进行APP抓包。 优点:1.能够无视证书抓取数据包 2.能够抓取多重协议数据包 缺点:本方式只能抓取,但是无法修改。 (由于我在实践中找多个博客一起对比翻阅中&#…

注意力机制Attention、CA注意力机制

一、注意力机制 产生背景: 大数据时代,有很多数据提供给我们。对于人来说,可以利用重要的数据,过滤掉不重要的数据。那对于模型来说(CNN、LSTM),很难决定什么重要、什么不重要,因此…

pip 配置镜像加速安装

在使用pip安装Python第三方库时,默认是使用pip官网的非常慢,可通过配置国内镜像源加速下载速度,以下是如何使用国内镜像源安装Python库的两种常见方式: 临时使用镜像源安装 如果你只是想临时使用某个镜像源安装单个或几个库&…

云仓酒庄2024年培训专业化:强化销售与品酒技能,酒业新动态

云仓酒庄2024年培训专业化:强化销售与品酒技能,共筑酒业新动态 在风云变幻的市场竞争中,云仓酒庄始终秉持着创新、进取的理念,不断探索与实践,以推动酒业行业的持续健康发展。2024年,云仓酒庄在培训专业化…

Hadoop大数据应用:HDFS 集群节点缩容

目录 一、实验 1.环境 2.HDFS 集群节点缩容 二、问题 1.数据迁移有哪些状态 2.数据迁移失败 一、实验 1.环境 (1)主机 表1 主机 主机架构软件版本IP备注hadoop NameNode (已部署) SecondaryNameNode (已部署…

c++ 面试100个题目中的编程题目

88、下列程序的运行结果是? #include <stdlib.h> #include <stdio.h> #include <string.h> #include <iostream> const char* str = "vermeer"; using namespace std; int main(){ const char* pstr = str;cout << "The add…

Xilinx LVDS ISERDESE2

ISERDESE2 7 系列 FPGA 是一款专用的串行到并行转换器,具有特定的时钟和逻辑功能,旨在促进高速源同步应用的实现。该ISERDESE2避免了在FPGA架构中设计解串器时遇到的额外时序复杂性. ISERDESE2功能包括: 1,专用解串器/串行转换器 ISERDESE2解串器可实现高速数据传输,而无需…

Android studio 性能调试

一、概述 Android studio 的Profiler可用来分析cpu和memory问题&#xff0c;下来进行说明介绍。 二、Android studio CPU调试 从开发模拟器或设备中启动应用程序&#xff1b; 在 Android Studio 中&#xff0c;通过选择View > Tool Windows > Profiler启动分析器。 应…

uniapp遇到的问题

【uniapp】小程序中input输入框的placeholder-class不生效解决办法 解决&#xff1a;写在scope外面 uniapp设置底部导航 引用&#xff1a;https://www.jianshu.com/p/738dd51a0162 【微信小程序】moveable-view / moveable-area的使用 https://blog.csdn.net/qq_36901092/…

upload文件上传漏洞复现

什么是文件上传漏洞&#xff1a; 文件上传漏洞是指由于程序员在对用户文件上传部分的控制不足或者处理缺陷&#xff0c;而导致的用户可以越过其本身权限向服务器上上传可执行的动态脚本文件。这里上传的文件可以是木马&#xff0c;病毒&#xff0c;恶意脚本或者WebShell等。“…

linux sshd_config配置说明

[root01 ssh]# cat sshd_config #######################SSH Base Config################## #######通过OpenSSH工具入xshell连接默认端口 可以改成其他默认是22 PAM 认证过程 1&#xff09;使用者执行/usr/bin/passwd程序&#xff0c;并输入密码。 2&#xff09;passwd开…

AntV L7的填充图

本案例使用L7库和Mapbox GL JS绘制填充图。 文章目录 1. 引入 CDN 链接2. 引入组件3. 创建场景4. 绘制填充图4.1. 获取数据4.2. 定义颜色数组4.3. 创建多边形图层4.4. 创建线图层4.5. 添加图层4.6. 绘制填充图代码 5. 演示效果6. 代码实现 1. 引入 CDN 链接 <script src&quo…