Smooth min-entropy

news/2025/3/31 12:11:38/文章来源:https://www.cnblogs.com/CherryWull/p/18797856

信息论的神奇妙妙工具——Smoothed entropy (平滑熵)

回顾min-entropy

首先有\(\infty\)-divergence

\[D_{\infty}(P \| Q) = \max_{x} \log \frac{P(x)}{Q(x)} \]

\(D_{\infty}\)定义min-entropy

\[\begin{aligned}H_{\min}(X) &= - D_{\infty}(P_X\| 1) = -\log \max_{x} P_X(x) \\H_{\min}^{\downarrow}(Y|X) &= - D_{\infty}(P_{XY}\|P_{X}) = - \log \max_{y} P_{Y|X}(y|x) \\H_{\min}^{\uparrow}(Y|X) &= \max_{Q_X} - D_{\infty}(P_{XY}\|Q_X) \end{aligned} \]

smoothing 是什么?

从min-entropy的定义来看,这并不是一个有着良好行为的量,因为它只关注(条件)概率分布的最大值,这使得它容易受意外极值的影响。
像这两个分布

img

这两个分布的距离(total variation distance)只有1/8,但min-entropy分别为3,2。在样本量更大时这种效应会更加明显。例如\(n=1000\)的均匀分布\(P(x) = 1/1000,\text{for } x=1,\dots, 1000\),与\(Q(1)=1/100,Q(x)=1/1000,\text{for } x=2,\dots,901\),其min-entropy相差\(3.3\)但距离只有\(1/100\)

为了避免min-entropy受个别意外值的影响,可以考虑\(P_X\)邻域的一些分布并取他们的min-entropy的最大值。邻域由total variation distance刻画

\[T(P,Q) = \frac{1}{2}\sum_{x}|P(x)-Q(x)| \]

\(P_X\)的邻域是一个半径为\(\varepsilon\)的“球”

\[\mathcal{B}^\varepsilon(P_X) = \{Q_X \mid \forall x, Q_X(x) \le P_X(x), T(P_X,Q_X) \le \varepsilon\} \]

(出于一些technical上的考虑,我们额外要求\(Q\)始终小于\(P\)

于是可以定义smoothed min-entropy

\[\begin{aligned}H_{\min}^{\varepsilon}(X)_P &= \max_{Q_X \in \mathcal{B}^\varepsilon(P_X) } H_{\min}(X)_Q \\H_{\min}^{\downarrow,\varepsilon} (Y|X)_P &= \max_{Q_{XY} \in \mathcal{B}^{\varepsilon}(P_{XY})} - D_{\infty}(Q_{XY}\| P_X) \\H_{\min}^{\uparrow, \varepsilon} (Y|X)_P &= \max_{Q_{XY} \in \mathcal{B}^\varepsilon (P_{XY})} \max_{R_X} -D_{\infty}(Q_{XY} \| R_X) \end{aligned} \]

一些remark

  • 注意\(H_{\min}^{\downarrow,\varepsilon}\)的定义中,\(\max\)后面的项为\(D_{\infty}(Q_{XY}\|P_{X})\)而非\(D_{\infty}(Q_{XY}\|Q_{X})\)
  • \(H_{\min}^{\uparrow, \varepsilon}\)的定义中,第一个\(\max\)是over subnormalized \(Q_{XY}\),第二个\(\max\)是over normalized \(R_{X}\)(\(R_X\)必须归一化)。

简单应用:用smoothed min-entropy重新表述渐进均分性(AEP)

完整的渐进均分性还需要用到max-entropy,我们这里只一窥其貌,使用AEP推导出\(H^{\varepsilon}_{\min}\)在独立同分布变量下的渐进行为。
\(X^n\)\(n\)个独立同分布随机变量,根据AEP,有

\[\Pr\left[ 2^{-n(H(X)+\delta)} \le P_{X^n}(X^n) \le 2^{-n(H(X)-\delta)} \right] \ge 1-\varepsilon \]

或者

\[\Pr\left[ X^n \in \mathcal{T}^n_\delta \right] \ge 1-\varepsilon \]

其中\(\mathcal{T}^n_\delta\)为典型集,\(\delta\)可以任意小,\(\varepsilon\)\(\delta\)的关系由concentration inequality给出(例如Hoeffding's inequality)。

根据smoothed min-entropy的定义,构造一个截断后的\(P_{X^n}\)

\[Q_{X^n}(x^n) = \begin{cases}P_{X^n}(x^n), & x^n \in \mathcal{T}^n_\delta \\0, & \text{otherwise} \end{cases} \]

显然\(Q_{X^n} \in \mathcal{B}^\varepsilon(P_{X^n})\),因此

\[H_{\min}^{\varepsilon}(X^n)_P \ge H_{\min}(X^n)_Q \ge n(H(X)-\delta) \]

可以看出在渐进条件下,\(H_{\min}^{\varepsilon}(X^n)_P\)会接近\(nH(X)\),事实上我们有

\[\lim_{\varepsilon \to 0}\lim_{n \to \infty} \frac{1}{n} H_{\min}^{\varepsilon}(X^n) = H(X) \]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/907109.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3封装支持Base64导出的电子签名组件

效果图准备工作 组件内用到elementPlus,vue-esign组件,使用前提前安装好。组件代码 <template><!-- 签名容器 --><div class="sign-container" ><div class="sign-preview" :class="[sizeClass, { has-sign: base64Img }]&quo…

产品经理研读:Agent的九种设计模式(图解+代码)

资料来源:火山引擎-开发者社区 引言 上周五我在一个社群里做了一次分享,题目是《从 YC 项目看 AI 趋势以及 AI agent 开发工具类产品该如何设计》,收到了大家不错的反馈,这篇文章和大家详细讲讲分享中提到的 Agent设计模式 1.Agent 的九种设计模式。 先来一张图镇楼,欢迎大…

获取字节火山DeepSeek系列 API完整教程及超多实用玩法!

资料来源:火山引擎-开发者社区原文首发在“Equity AI”公众号,内容经由“WaytoAGI社区整理汇总”,本篇包含了火山DeepSeek API使用的几种方式:飞书多维表格调用,Coze智能体调用,浏览器插件调用。快薅羊毛用起来吧!发现火山方舟大模型服务平台的模型服务计费文档悄咪咪的…

MCR101-ASEMI电源控制电路专用MCR101

MCR101-ASEMI电源控制电路专用MCR101编辑:LL MCR101-ASEMI电源控制电路专用MCR101 型号:MCR101 品牌:ASEMI 封装:TO-92 阻断电压:600V~800V 通态电流:1.0A 类型:单向可控硅 工作温度:-40℃~150℃ MCR101在工业自动化、智能家居和能源管理领域,"精准控制"始终…

IDEA中如何创建scala的对象

1、创建项目 打开Intellij IDEA,点击“Create New Project”。 选择“Java”作为Language,选择“Maven”作为Build System,选择JDK版本; 输入GroupId的名称,一般是com.xxx; 设置完成后点击“Create”。 2、配置Maven File -> Settings -> Build,Execution,Deploym…

fastjson-1.2.68-bypass

fastjson-1.2.68 绕过 在 1.2.47 的利用 mappings 缓存恶意类绕过 autoType 修复后,fastjson 又陆续爆出来了一些黑名单的绕过方式。直到 1.2.68 又有了新的思路去绕过 autoType 安全机制 我们先来看看 fastjson1.2.68 又引入了哪些安全机制 1.2.68 引入了一个新的安全机制 sa…

【日记】感觉沉着冷静是很难得的品质(1200 字)

正文今天不太忙。居然看了一半时间的书,而且居然从零看了一半多了。昨天晚上,一个偶然的原因,看了六层楼跟别人聊天的视频。其实上班之后已经蛮久都没有看他了,时间真的很稀缺。视频中提到了他写的书。他本身表达能力就很好,我想着书应该也不差,就下了一本电子版。刚开始…

Supergateway:MCP服务器的远程调试与集成工具

Supergateway 是一款专为 MCP(Model Context Protocol)服务器设计的远程调试与集成工具,通过 SSE(Server-Sent Events)或 WebSocket(WS)协议实现基于 stdio 的服务器与客户端的高效通信。以下是其核心功能及使用场景的详细解析:核心功能多协议支持支持 SSE 和 WebSocke…

怎么办?听说Windows远程桌面要撤销?解决办法还真有!

3月11日微软正式宣布,将在2025年5月27日关闭并从Microsoft Store中移除Windows远程桌面应用程序,用户将无法通过旧版远程桌面访问这些功能。微软公司此次决定下架Microsoft远程桌面应用,主要是为了推广功能更为强大的Windows App,这种23年上线的解决方案提供了更加统一的界…

电脑文件同步软件,想要备份电脑文方法有哪些?

备份电脑文件的方法有多种,可根据需求选择适合的方案。以下是常见的备份方式及工具推荐,涵盖不同场景:一、使用系统内置工具 Windows 文件历史记录 方法: 连接外部硬盘或网络驱动器。 搜索「文件历史记录」→ 选择驱动器 → 开启自动备份。 可设置备份频率(如每小时)。 二…

我的家庭实验室服务器集群硬件清单

概述 之前有热心读者想要了解我的家庭实验室服务器集群的硬件配置清单. 所以有这篇文章.📝声明: 不是广告, 不是推广, 不是软广.先放2张照片:📝声明: 确实没有理线天赋, 这已经是我理线的极限了, 求轻喷.😂硬件包括:网络一图左下亮绿光的: 瑞莎 Radxa E20C 一图中下: 兮克…

python+pytest+loguru+allure日志封装

一、日志类封装from io import StringIO import sys import os from loguru import logger sys.path.append((os.path.abspath(os.path.join(os.path.dirname(__file__), ../)))) project_path = os.path.dirname(os.path.join(os.path.dirname(__file__))) log_path = os.path…