信息论基础:生日问题

生日问题

我的小学同班同学小琦,和我是同一天生日。每次聚会,我俩同时在场时,我们都会向其他人提起这一点。我们觉得这是很幸运的。

这个概率大吗?要回答这样的问题,需要把几个问题区分清楚。

  • 问题1:对于特定的某个同学,他与我生日相同的概率是多少?这个概率是1/365,并不大。
  • 问题2:某班有𝑆个学生,有人与我生日相同的概率是多少?这个概率大约是(𝑆-1)/365,并不小。
  • 问题3:某班有𝑆个学生,至少两个学生生日相同(月和日相同)的概率是多少?

问题3是概率中的生日问题(Birthday Problem)。首先,计算没有人生日相同的概率。为了表达式的含义更明确,用𝐴表示一年的天数365。所有人生日不同的概率为:
P = A ( A − 1 ) ( A − 1 ) . . . ( A − S + 1 ) A S . P = \frac {A(A-1)(A-1) ... (A-S+1)} {A^S}. P=ASA(A1)(A1)...(AS+1).

至少有两人生日相同的概率为1−𝑃。下图绘制了至少两人生日相同的概率(纵坐标)与人数(横坐标)的关系。如果班里有23人,至少有两人生日相同的概率>50%;如果有57人,概率>99%。

如果要和人打赌一个班有没有相同生日的人,只要人数不少于23人,就可以赌有,获胜的概率超过一半。

还有另一个问题。令𝑋表示班里生日相同的对数。𝑋的期望是多少?
E ( X ) = S ( S − 1 ) 2 1 A . E(X) = \frac {S(S-1)} 2 \frac 1 A. E(X)=2S(S1)A1.

生物特征识别也有生日问题。在生物特征系统中,一个人被编码为其的生物特征,例如人像、指纹、虹膜。如果生物特征识别算法认为两个人的生物特征重了,就是发生了错误匹配(False Match)。任意一对生物特征的错误匹配概率(FMR,False Match Rate),类似任意两个人的生日相同概率(1/A)。只要有两个人的生物特征重了,就叫做发生冲突。假设整个系统一共有𝑆人,识别算法的FMR需要多小,才能使冲突概率约为1/2?

不冲突的概率为:
( 1 − F M R ) S ( S − 1 ) 2 = 0.5 (1-FMR)^{\frac {S(S-1)} 2} = 0.5 (1FMR)2S(S1)=0.5
得出:
F M R = 1 − 0. 5 2 S ( S − 1 ) FMR = 1-0.5^ {\frac 2 {S(S-1)}} FMR=10.5S(S1)2

下图绘制了FMR和𝑆的关系,由于两个数字的范围都太大,用对数坐标。从中看出,有1亿人时,冲突概率1/2对应的FMR为 1 0 − 16 10^{-16} 1016

生物特征冲突在大规模身份识别系统中容易出现。因此,大规模身份识别系统对于FMR要求非常高。例如,印度曾经没有全民的身份证,有人根本没有身份,而有人有多重身份,这会带来很多社会问题。后来印度实施了Aadhaar项目,要给每个印度人一个唯一的身份证。印度有14亿多人口,为了保证尽可能低的FMR(因此尽可能低的冲突概率),采集了每个人的人像、十指指纹和一对虹膜。

每当有人来申请身份证,要在所有已经发证的数据库中,进行生物特征查重。当所有人的身份证都办完的时候,14亿人之间就全部做过比对了。一共是 2 × 1 0 18 2 \times 10^{18} 2×1018,200亿亿次比对。这就要求FMR要非常低。

为了降低FMR,Aadhaar项目融合了三种生物特征。实验表明,指纹加虹膜的效果特别有效。在一个大规模的测试库上,融合后的错误率显著下降。

参考文献

  1. A.K. Jain. http://biometrics.cse.msu.edu/Presentations/MBZUAI_Sept_1_2020.pdf

  2. Daugman, John. “Collision avoidance on national and global scales: Understanding and using big biometric entropy.” TechRxiv (2021).

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/596990.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EXCEL地理数据处理工具(地图任务)

版本号 作者 修订内容 发布日期 1.0 小O 更新至0705版 2022-4-28 1.1 小O 更新至0772版 2024年4月3日 一、概述 小O地图EXCEL插件版提供基于EXCEL表格进行地理数据处理、地图可视化、地图绘图等功能,地理工具是用户使用频率很高的功能模块。地理工具能…

2024HW-->Wireshark攻击流量分析

在HW中,最离不开的,肯定是看监控了,那么就要去了解一些wireshark的基础用法以及攻击的流量!!!! 1.Wireshark的基本用法 比如人家面试官给你一段流量包,你要会用 1.分组详情 对于我…

构建未来数字化世界的统一用户中心产品架构

随着数字化时代的到来,用户数据管理变得愈发复杂,各类应用和服务的涌现使得用户信息分散存储,导致了数据孤岛和体验碎片化的问题。在这样的背景下,统一用户中心产品架构应运而生,为构建数字化世界提供了全新的解决方案…

Linux 常用指令及其理论知识

个人主页:仍有未知等待探索-CSDN博客 专题分栏:http://t.csdnimg.cn/Tvyou 欢迎各位指教!!! 目录 一、理论知识 二、基础指令 1、ls指令(列出该目录下的所有子目录和文件) 语法: …

基于单片机电容介电常数测量显示系统设计

**单片机设计介绍,基于单片机电容介电常数测量显示系统设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机电容介电常数测量显示系统的设计,是一个集成了电子技术、单片机编程、电容测量以及显…

GD32F470_寻迹避障模块 TCRT5000红外反射传感器模块移植

2.6 红外循迹传感器 红外循迹传感器采用TCRT5000红外反射传感器,一种集发射与接收于一体的光电传感器,它由一个红外发光二极管和一个NPN红外光电三极管组成。检测反射距离1mm-25mm适用,传感器特设M3固定安装孔,调节方向与固定方便…

websokcet服务端实现

一/websokcet服务端实现 步骤一&#xff1a; springboot底层帮我们自动配置了websokcet&#xff0c;引入maven依赖 1 2 3 4 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-websocket</arti…

红黑树深度解析:LEFT-ROTATE操作的艺术与实践

红黑树深度解析&#xff1a;LEFT-ROTATE操作的艺术与实践 一、什么是LEFT-ROTATE&#xff1f;二、LEFT-ROTATE的步骤三、LEFT-ROTATE的效果四、例子五、伪代码示例六、伪代码示例七、结论 在二叉搜索树中&#xff0c;旋转操作是维护树平衡的重要技术之一&#xff0c;特别是在红…

STC89C51学习笔记(三)

STC89C51学习笔记&#xff08;三&#xff09; 综述&#xff1a;本文讲述了通过51单片机控制LED闪烁、流水灯、按键控制LED亮灭、按键控制LED实现二进制、按键控制LED左右移。 一、LED 1.LED闪烁 1&#xff09;LED电路原理 LED采用共阳极&#xff0c;当LED另一端为低电平时…

GA-SVM,基于GA遗传算法优化SVM支持向量机回归预测(多输入单输出)

基于遗传算法&#xff08;Genetic Algorithm, GA&#xff09;优化支持向量机&#xff08;Support Vector Machine, SVM&#xff09;用于回归预测是一个常见的任务。在这个任务中&#xff0c;我们使用GA来寻找SVM的最佳超参数配置&#xff0c;以最大化回归性能指标&#xff0c;例…

一文带你初识DDD领域驱动设计

DDD是什么&#xff1f; DDD&#xff08;Domain-driven design&#xff09;&#xff0c;是领域驱动设计的缩写。 然而&#xff0c;领域驱动设计&#xff0c;是什么&#xff1f;很多书籍&#xff0c;很多博客&#xff0c;都没有对领域驱动设计下一个标准的定义。 就连《实现领…

全坚固笔记本丨工业笔记本丨三防笔记本相较于普通笔记本有哪些优势?

三防笔记本和普通笔记本在设计和性能方面存在显著差异&#xff0c;三防笔记本相较于普通笔记本具备以下优势&#xff1a; 三防笔记本通常采用耐磨、耐摔的材料&#xff0c;并具有坚固的外壳设计&#xff0c;能够承受恶劣环境和意外碰撞&#xff0c;有效保护内部组件不受损坏。相…