在link prediction的预测任务中。准确率,置信度和p-test的结果一般是怎样的关系?

news/2025/4/1 23:21:51/文章来源:https://www.cnblogs.com/GraphL/p/18801435

在链接预测任务中,准确率、置信度和 p-test 的结果一般存在以下关系:

准确率与置信度

  • 正相关关系:通常情况下,准确率越高,置信度也会越高。例如,在一些基于图神经网络的链接预测算法中,当模型对预测结果的置信度较高时,往往意味着模型能够更准确地识别出潜在的链接。比如AGEE算法通过结合结构图和特征图的预测概率来提高链接预测的准确率,当调整超参数使模型综合考虑结构和特征信息后,准确率提升的同时,对预测结果的置信度也相应增加。
  • 非线性关系:准确率和置信度之间的关系并非简单的线性关系。在某些情况下,即使置信度较高,准确率也可能不会显著提升。这可能是因为数据集的复杂性、噪声等因素对模型的预测能力产生了影响。

准确率与 p-test

  • 间接关系:准确率与 p-test 结果之间存在间接关系。p-test 主要用于检验预测结果的统计显著性,而准确率是衡量预测结果好坏的一个直接指标。一般来说,当准确率较高时,p-test 的结果往往更倾向于拒绝原假设,即认为预测结果具有统计显著性。
  • 受数据分布影响:如果数据集中存在大量噪声或样本分布不均匀,即使准确率较高,p-test 的结果也可能不显著。这是因为 p-test 对数据的分布和样本量较为敏感。

置信度与 p-test

  • 相关性:置信度与 p-test 结果之间也存在一定的相关性。较高的置信度通常意味着模型对预测结果有更强的信心,这可能会使得 p-test 的结果更倾向于拒绝原假设。
  • 不确定性:然而,置信度高并不一定保证 p-test 的结果显著。p-test 的结果还受到样本量、数据分布等因素的影响。

怎么计算?

好的,我们通过一个简单的例子来说明如何计算准确率、置信度和进行p-test。

例子

假设我们有一个简单的链接预测任务,数据集包含100个样本,其中50个是正样本(存在链接),50个是负样本(不存在链接)。

步骤1:计算准确率

我们使用一个模型进行预测,得到以下结果:

  • 正确预测正样本:40个
  • 正确预测负样本:45个
  • 错误预测正样本:10个
  • 错误预测负样本:5个

准确率(Accuracy)的计算公式为:
[ \text{准确率} = \frac{\text{正确预测的样本数}}{\text{总样本数}} ]

代入数据:
[ \text{准确率} = \frac{40 + 45}{100} = 0.85 ]

步骤2:计算置信度

置信度通常由模型的输出概率来表示。假设我们的模型对每个样本输出一个概率,表示该样本存在链接的概率。我们取模型输出的平均概率作为置信度的估计。

假设模型对50个正样本的平均输出概率为0.7,对50个负样本的平均输出概率为0.3。则置信度可以表示为:
[ \text{置信度} = \frac{0.7 + (1 - 0.3)}{2} = 0.7 ]

步骤3:进行p-test

p-test用于检验预测结果是否显著。我们使用二项分布来计算p值。假设随机猜测的准确率为0.5(因为正负样本各占一半)。

二项分布的公式为:
[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} ]

其中,( n )是总样本数,( k )是正确预测的样本数,( p )是随机猜测的准确率。

我们计算得到的准确率为0.85,即正确预测了85个样本。因此,( n = 100 ),( k = 85 ),( p = 0.5 )。

p值的计算公式为:
[ p\text{-value} = P(X \geq 85) = \sum_{i=85}^{100} \binom{100}{i} 0.5^i (1-0.5)^{100-i} ]

使用统计软件或计算器可以得到:
[ p\text{-value} \approx 1.03 \times 10^{-10} ]

结论

  • 准确率:0.85
  • 置信度:0.7
  • p-test:p值约为 ( 1.03 \times 10^{-10} ),远小于0.05,说明预测结果具有统计显著性。

这个例子展示了如何计算准确率、置信度和进行p-test。实际应用中,这些计算可能更加复杂,但基本原理是相同的。

这三个指标分别表示什么意义?

好的,我们通过一个简单的例子来说明如何计算准确率、置信度和进行p-test。

例子

假设我们有一个简单的链接预测任务,数据集包含100个样本,其中50个是正样本(存在链接),50个是负样本(不存在链接)。

步骤1:计算准确率

我们使用一个模型进行预测,得到以下结果:

  • 正确预测正样本:40个
  • 正确预测负样本:45个
  • 错误预测正样本:10个
  • 错误预测负样本:5个

准确率(Accuracy)的计算公式为:
[ \text{准确率} = \frac{\text{正确预测的样本数}}{\text{总样本数}} ]

代入数据:
[ \text{准确率} = \frac{40 + 45}{100} = 0.85 ]

步骤2:计算置信度

置信度通常由模型的输出概率来表示。假设我们的模型对每个样本输出一个概率,表示该样本存在链接的概率。我们取模型输出的平均概率作为置信度的估计。

假设模型对50个正样本的平均输出概率为0.7,对50个负样本的平均输出概率为0.3。则置信度可以表示为:
[ \text{置信度} = \frac{0.7 + (1 - 0.3)}{2} = 0.7 ]

步骤3:进行p-test

p-test用于检验预测结果是否显著。我们使用二项分布来计算p值。假设随机猜测的准确率为0.5(因为正负样本各占一半)。

二项分布的公式为:
[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} ]

其中,( n )是总样本数,( k )是正确预测的样本数,( p )是随机猜测的准确率。

我们计算得到的准确率为0.85,即正确预测了85个样本。因此,( n = 100 ),( k = 85 ),( p = 0.5 )。

p值的计算公式为:
[ p\text{-value} = P(X \geq 85) = \sum_{i=85}^{100} \binom{100}{i} 0.5^i (1-0.5)^{100-i} ]

使用统计软件或计算器可以得到:
[ p\text{-value} \approx 1.03 \times 10^{-10} ]

结论

  • 准确率:0.85
  • 置信度:0.7
  • p-test:p值约为 ( 1.03 \times 10^{-10} ),远小于0.05,说明预测结果具有统计显著性。

这个例子展示了如何计算准确率、置信度和进行p-test。实际应用中,这些计算可能更加复杂,但基本原理是相同的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/908439.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

visual stdio 使用CMake

基础知识 工具>选项>CMake>常规 选中从不使用CMake预设重启 visual stdio,点击打开本地文件夹(F),打开CMakeList.txt根目录此时会在CMake根目录自动生成CMakeSettings.json文件,使用visual stdio文件打开CMakeSettings.json如果打开时,是json文件时,可以右键CMa…

mysql InnoDB的事务

一、事务的概念 一组数据库操作要么全部成功,要么全部失败,目的是为了保证数据的最终一致性 二、事务的四大特性(ACID)原子性(Actomicity):当前事务的操作要么成功,要么失败,原子性是由undo log日志来保证 一致性(Consistency):使用事务的最终目的,由业务代码正确…

如何使用 OpenAI Agents SDK 构建 MCP

1.概述 OpenAI Agents SDK 现已支持 MCP(模型上下文协议),这是 AI 互操作性的重大变革。这使开发人员能够高效地将 AI 模型连接到外部工具和数据源。本篇博客,笔者将指导使用 OpenAI Agents SDK 构建 MCP 服务器,以增强你的 AI 应用程序。 2.内容 2.1 什么是 MCP MCP 服务…

C语言打卡学习第11天(2025.3.30)(补发)

冒泡排序的一个学习。还了解了一个快速排序的“挖坑法”,能省变量位置,但挺难写的,挺有意思:把数组第一个元素放一个空作为一个标准值,第一个位置就空了出来,然后将第一个“暂时标准值”从最后一个数开始比较,后面小就放到第一个“坑”,然后“坑”又到后面了,再从前面…

C语言打卡学习第10天(2025.3.29)(补发)

指针和数组的学习,数组现在能做到基本掌握和简单运用,指针有些难,还是得练

FastAPI中的Pydantic密码验证机制与实现

title: FastAPI中的Pydantic密码验证机制与实现 date: 2025/03/31 00:04:51 updated: 2025/03/31 00:04:51 author: cmdragon excerpt: FastAPI 中通过 Pydantic 模型实现密码验证,采用分层机制确保高效与灵活扩展。验证流程包括基础类型检查、长度验证、复杂度验证和泄露检…

PicGo+Github图床配置

PicGo+Github图床配置 参考 PicGo指南 PicGo+Github图床配置配置 Github 图床 创建 Github 仓库登录 Github,新建一个公开(Public)或私有(Private)仓库 (我个人选择新建公开仓库) 用于存储图片,仓库名任意取,例如 image-host​,进入新建的仓库,点击 Create a codespac…

独立按键控制 LCD1602 显示不同的谚语

前言 今天我又学到了一句话 “好的开始是成功的一半” 英语就是 “Well Begun Is Half Done” 所以希望能够通过独立按键,来控制LCD1602显示不同的谚语 演示函数数组的使用 错误用法 void (*sayings)(void)[MAX_SAYING] = {attitude,well_begun};报错正确用法 void (*sayings[…

OpenEuler RISC-V 上跑bitcoin(实战版)

不久前刚在OpenEuler 24.09 RISC-V上部署了 bitcoin,不过还没跑起来,这次我打算在这个环境下面运行一些应用服务,体验一下 OERV 的开发感觉。编译出来的 bitcoin 主要有几个命令,bitcoin-cli、bitcoind、bitcoin-util、bitcoin-wallet、bitcoin-tx和test_bitcoin。bitcoind…

javawebDay3-Maven框架

1.添加依赖 eg<dependencies><dependency><groupId></groupId><artifactId></artifactId></dependency></dependencies>从外部导入jar包等无需手动添加依赖 2.集成度高,eclipse和intellIDEA都能使用,在不同的操作系统也可以使…

Five Hundred Miles

一百英里 是自由,是初出茅庐的憧憬。 二百英里 是快乐,是逃离故里的喜悦。 三百英里 是忧伤,是萦绕心间的挂念。 四百英里 是思恋,是莺歌燕舞的家乡。 五百英里 是乡愁,是一去不返的凄凉。