熵 | 无线通信知识

文章目录

  • 一、信息论(熵、联合熵、条件熵)
  • 二、Bernoulli熵
  • 三、联合熵和条件熵
  • 四、互信息
  • 五、相对熵(KL距离)
  • 六、微分熵
  • 七、最大熵分布
  • 常需要的不等式公式

一、信息论(熵、联合熵、条件熵)

熵定义: H ( X ) = E [ − l o g 2 p ( x ) ] = − ∑ x ∈ X p ( x ) l o g 2 p ( x ) H(X)=E[-log_2p(x)]=-\sum_{x\in X}p(x)log_2p(x) H(X)=E[log2p(x)]=xXp(x)log2p(x)
note

  1. H(X)是X的平均香农信息内容
  2. H(X)是每个符号的平均信息量
  3. 二元问题(抛硬币),H(X)取值为[H(X),H(X)+1]

为什么用 l o g 2 ( . ) log_2(.) log2(.)衡量信息

非负性: f ( p ) ≥ 0 f(p)\ge0 f(p)0, 0 ≤ p ≤ 1 0\le p\le1 0p1
特殊点:当p=0, f ( p ) = ∞ f(p)=\infty f(p)=
可加性
单调递增连续性 ??

二、Bernoulli熵

符号集 χ = [ 0 , 1 ] \chi=[0,1] χ=[0,1],对应的概率 p ⃗ = [ p , 1 − p ] \vec{p}=[p,1-p] p =[p,1p]
Bernoulli熵: H ( X ) = H ( p ) = − p l o g 2 p − ( 1 − p ) l o g 2 ( 1 − p ) H(X)=H(p)=-plog_2p-(1-p)log_2(1-p) H(X)=H(p)=plog2p(1p)log2(1p)
note:

  1. 通常用 H ( p ) H(p) H(p)表示 H ( X ) H(X) H(X)
  2. p=0 or 1时, H ( p ) = 0 H(p)=0 H(p)=0
  3. H ( p ) H(p) H(p)是p的凸函数
  4. p=0.5, H ( p ) H(p) H(p)最大
  5. H ( p ) H(p) H(p)的取值范围 0 ≤ H ( p ) ≤ l o g 2 ∣ χ ∣ 0\le H(p)\le log_2|\chi| 0H(p)log2χ

请添加图片描述

三、联合熵和条件熵

联合熵:
H ( X , Y ) = − E l o g p ( x , y ) = − ∑ x ∈ X ∑ y ∈ Y p ( x , y ) l o g p ( x , y ) H(X,Y)=-Elogp(x,y)=-\sum_{x\in X} \sum_{y\in Y} p(x,y)logp(x,y) H(X,Y)=Elogp(x,y)=xXyYp(x,y)logp(x,y)
条件熵
H ( Y ∣ X ) = − E l o g ( y ∣ x ) = − ∑ x ∈ X ∑ y ∈ Y p ( x , y ) l o g p ( y ∣ x ) H(Y|X)=-Elog(y|x)=-\sum_{x\in X} \sum_{y\in Y}p(x,y)logp(y|x) H(YX)=Elog(yx)=xXyYp(x,y)logp(yx)
H ( Y ∣ X ) = ∑ x ∈ X p ( x ) H ( Y ∣ X = x ) H(Y|X)=\sum_{x\in X}p(x)H(Y|X=x) H(YX)=xXp(x)H(YX=x)
熵的链式法则

  1. H ( X , Y ) = H ( X ) + H ( Y ∣ X ) H(X,Y)=H(X)+H(Y|X) H(X,Y)=H(X)+H(YX)
  2. H ( X , Y ∣ Z ) = H ( X ∣ Z ) + H ( Y ∣ X , Z ) H(X,Y|Z)=H(X|Z)+H(Y|X,Z) H(X,YZ)=H(XZ)+H(YX,Z)
  3. H ( X 1 , X 2 , . . . . X n ) = ∑ i = 1 n H ( X i ∣ X i − 1 , . . . . X 1 ) H(X_1,X_2,....X_n)=\sum_{i=1}^{n}H(X_i|X_{i-1},....X_1) H(X1,X2,....Xn)=i=1nH(XiXi1,....X1)

四、互信息

定义:
I ( X ; Y ) = H ( X ) − H ( X ∣ Y ) = H ( X ) + H ( Y ) − H ( X , Y ) I(X;Y)=H(X)-H(X|Y)=H(X)+H(Y)-H(X,Y) I(X;Y)=H(X)H(XY)=H(X)+H(Y)H(X,Y)
互信息具有对称性

I ( X ; Y ) = H ( X ) − H ( X ∣ Y ) = H ( Y ) − H ( Y ∣ X ) I(X;Y)=H(X)-H(X|Y)=H(Y)-H(Y|X) I(X;Y)=H(X)H(XY)=H(Y)H(YX)
I ( X ; Y ) = H ( X ) + H ( Y ) − H ( X , Y ) I(X;Y)=H(X)+H(Y)-H(X,Y) I(X;Y)=H(X)+H(Y)H(X,Y)
I ( X ; Y ) = I ( Y , X ) I(X;Y)=I(Y,X) I(X;Y)=I(Y,X)
I ( X ; X ) = H ( X ) I(X;X)=H(X) I(X;X)=H(X)
I ( X ; Y ) ≥ 0 I(X;Y)\ge0 I(X;Y)0,当且仅当X Y互相独立时,等号成立

互信息的链式法则
I ( X 1 , X 2 , . . . . X n ; Y ) = ∑ i = 1 n I ( X i ; Y ∣ X i − 1 , . . . . , X 1 ) I(X_1,X_2,....X_n;Y)=\sum_{i=1}^nI(X_i;Y|X_{i-1},....,X_1) I(X1,X2,....Xn;Y)=i=1nI(Xi;YXi1,....,X1)

五、相对熵(KL距离)

D ( p ⃗ ∣ ∣ q ⃗ ) = ∑ x ∈ X p ( x ) l o g q ( x ) p ( x ) = E p ⃗ [ − l o g q ( x ) ] − H ( p ⃗ ) D(\vec{p}||\vec{q})=\sum_{x\in X}p(x)log\frac{q(x)}{p(x)}=E_{\vec{p}}[-logq(x)]-H(\vec{p}) D(p ∣∣q )=xXp(x)logp(x)q(x)=Ep [logq(x)]H(p )
D ( p ⃗ ∣ ∣ q ⃗ ) D(\vec{p}||\vec{q}) D(p ∣∣q )测量的是两个概率分布 p ⃗ \vec{p} p q ⃗ \vec{q} q 间的距离,并非真实距离
D ( p ⃗ ∣ ∣ q ⃗ ) ≥ 0 D(\vec{p}||\vec{q})\ge 0 D(p ∣∣q )0,当且仅当 p ⃗ \vec{p} p = q ⃗ \vec{q} q ,等号成立

六、微分熵

对于连续型随机变量,一个以f(x)为密度函数的连续型随机变量,X的微分熵h(x)为:
h ( x ) = ∫ − ∞ ∞ f X ( x ) l o g f X ( x ) d x = E − l o g f X ( x ) h(x)=\int_{-\infty}^{\infty}f_X{(x)}logf_X(x)dx=E-logf_X(x) h(x)=fX(x)logfX(x)dx=ElogfX(x)
note

  • 微分熵仅依赖于随机变量的概率密度函数,有时候将微分熵写为h(f)
  • 微分熵可以为负值

微分熵分类

均匀分布的微分熵高斯分布的微分熵多元高斯分布的微分熵
前提条件:随机变量服从均匀分布 X ∼ U ( a , b ) X\sim U(a,b) XU(a,b)高斯分布 X ∼ U ( μ , σ 2 ) X\sim U(\mu,\sigma^2) XU(μ,σ2) X 1 : n ∼ N ( m ⃗ , k ⃗ ) X_{1:n}\sim N(\vec{m},\vec{k}) X1:nN(m ,k )
pdf f ( x ) = { 1 b − a , x ∈ ( a , b ) ) 0 e l s e f(x)=\left\{\begin{matrix}\frac{1}{b-a} ,&x\in(a,b)) \\ 0 &else \end{matrix}\right. f(x)={ba1,0x(a,b))else f ( x ) = 1 ( 2 π σ 2 ) 1 2 e x p { − 1 2 σ 2 ( x − μ ) 2 } f(x)=\frac{1}{(2\pi\sigma^2)^{\frac{1}{2}}}exp\{-\frac{1}{2\sigma^2}(x-\mu)^2\} f(x)=(2πσ2)211exp{2σ21(xμ)2} f ( x ) = ∣ 2 π k ⃗ ∣ 1 2 e x p { − 1 2 ( x − m ⃗ ) T k ⃗ − 1 ( x − m ⃗ ) } f(x)=|2\pi\vec{k}|^\frac{1}{2}exp\{-\frac{1}{2}(x-\vec{m})^T\vec k^{-1}(x-\vec m)\} f(x)=∣2πk 21exp{21(xm )Tk 1(xm )}m:均值矢量 k ⃗ \vec k k 协方差矢量
微分熵 h ( x ) = ∫ a b f ( x ) l o g f ( x ) d x = l o g ( b − a ) h(x)=\int_a^bf(x)logf(x)dx=log(b-a) h(x)=abf(x)logf(x)dx=log(ba)当b-a<1时,h(x)<0 h ( x ) = − l o g e ∫ − ∞ ∞ f ( x ) l n f ( x ) d x = 1 2 l o g ( 2 π e σ 2 ) h(x)=-loge\int_{-\infty}^{\infty}f(x)lnf(x)dx=\frac{1}{2}log(2\pi e\sigma^2) h(x)=logef(x)lnf(x)dx=21log(2πeσ2) h ( x ) = 1 2 l o g ∣ 2 π e k ⃗ ∣ h(x)=\frac{1}{2}log|2\pi e\vec k| h(x)=21log∣2πek

七、最大熵分布

  1. 条件一:(幅值约束)对于r有限长范围(a,b)使其最大熵的分布是均匀分布
    u ( x ) = 1 b − a → u(x)=\frac{1}{b-a} \rightarrow u(x)=ba1 0 ≤ D ( f ∣ ∣ x ) → h f ( x ) = l o g ( b − a ) 0 \le D(f||x) \rightarrow h_f(x)=log(b-a) 0D(f∣∣x)hf(x)=log(ba)

  2. 条件二:(功率约束)给定协方差矩阵 k ⃗ \vec k k ,零均值的多元高斯分布能使熵在 ( − ∞ , ∞ ) n (-\infty,\infty)^n (,)n上最大
    ϕ ( x ) = ∥ 2 π k ⃗ ∥ 1 2 e x p { − 1 2 x T k ⃗ − 1 x ⃗ } \phi (x)=\|2\pi\vec{k}\|^\frac{1}{2}exp\{-\frac{1}{2}x^T\vec k^{-1}\vec x\} ϕ(x)=∥2πk 21exp{21xTk 1x };
    0 ≤ D ( f ∣ ∣ x ) = h f ( x ) − E f l o g ϕ ( x ) → h f ( x ) ≤ − ( l o g e ) E f ( − 1 2 l n ∣ 2 π k ⃗ ∣ − 1 2 x T k ⃗ − 1 x ) = h ϕ ( x ) 0 \le D(f||x)=h_f(x)-E_flog\phi(x) \rightarrow h_f(x)\le-(loge)E_f(-\frac{1}{2}ln|2\pi \vec k|-\frac{1}{2}x^T \vec k^{-1}x)=h_{\phi (x)} 0D(f∣∣x)=hf(x)Eflogϕ(x)hf(x)(loge)Ef(21ln∣2πk 21xTk 1x)=hϕ(x)

常需要的不等式公式

H ( Y ∣ X ) ≤ H ( X ) H(Y|X)\le H(X) H(YX)H(X),X和Y互相独立时,等号成立
H ( X 1 , X 2 , . . . . X n ) ≤ ∑ i = 1 n H ( X i ) H(X_1,X_2,....X_n)\le \sum_{i=1}^nH(X_i) H(X1,X2,....Xn)i=1nH(Xi),当且仅当 X i X_i Xi互相独立时等号成立

参考文章:通信算法基础知识汇总(5)、通信算法基础知识汇总(8)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/107838.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VRTK4⭐一.VRTK4和VRTK的区别 , 及VRTK4简介

文章目录 &#x1f7e5; VRTK4和VRTK的区别1️⃣ 版本区别2️⃣安装方式区别 &#x1f7e7; 安装VRTK41️⃣ AssetStore网址2️⃣安装不同功能的包 &#x1f7e9;Tilia的独立功能包介绍及配置方法&#x1f381;Tilia.CameraRigs.SpatialSimulator.Unity [重要]&#x1f381;Til…

Java“牵手”1688商品列表页数据采集+商品价格数据排序,商品销量排序数据,1688API接口采集方法

1688平台是阿里巴巴旗下的综合性B2B电子商务平台。该平台目前属于阿里巴巴集团旗下子公司&#xff0c;以批发和采购业务为核心&#xff0c;通过专业化运营、全面优化企业电子商务的业务模式&#xff0c;主要分为垂直行业市场及特色服务频道&#xff0c;垂直行业市场主要针对行业…

反序列化漏洞复现(typecho)

文章目录 执行phpinfogetshell 执行phpinfo 将下面这段代码复制到一个php文件&#xff0c;命名为typecho_1.0-14.10.10_unserialize_phpinfo.php&#xff0c;代码中定义的类名与typecho中的类相同&#xff0c;是它能识别的类&#xff1a; <?php class Typecho_Feed{const…

设计模式课件

设计模式 创建型设计模式的分类&#xff0c;定义结构型设计模式的分类&#xff0c;定义行为型设计模式的分类&#xff0c;定义 设计模式的分类&#xff0c;在23种设计模式中&#xff0c;每一种属于哪一种的设计模式设计模式的应用场景设计模式的图形&#xff08;考察较少&#…

1分钟了解音频、语音数据和自然语言处理的关系

机器学习在日常场景中的应用 音频、语音数据和自然语言处理这三者正在不断促进人工智能技术的发展&#xff0c;人机交互也逐渐渗透进生活的每个角落。在各行各业包括零售业、银行、食品配送服务商&#xff09;的多样互动中&#xff0c;我们都能通过与某种形式的AI&#xff08;…

MySQL与ES数据同步之异步调用

文章目录 简述SpringBoot项目引入依赖配置文件项目结构实体类配置类RabbitMQ交换机队列声明&#xff0c;绑定配置类回调接口配置类 Mapper接口UserMapper接口UserEsMapper Controller类Service接口Service实现类监听类/消费者 简述 上一篇是同步调用&#xff0c;我们在中间加上…

新手询问想要成功学好嵌入式开发有什么建议吗?

今日话题&#xff0c;想要成功学好嵌入式开发有什么建议吗&#xff1f;想要学好的话选择一门合适的编程语言是关键。虽然嵌入式开发支持多种语言&#xff0c;但C和C仍然是最常用的。如果你是初学者&#xff0c;从学习C语言开始是一个不错的选择。它相对容易学习&#xff0c;而且…

MCU芯片测试:性能指标测试痛点是什么?ATECLOUD能否解决?

MCU芯片测试指标的核心是性能指标&#xff0c;包括处理器性能、存储器容量和读写速度&#xff0c;外设性能等。芯片测试对自动化测试的要求很高&#xff0c;ATECLOUD-IC不仅解决了传统测试方法的问题&#xff0c;而且也可以满足芯片测试的高要求&#xff0c;高效地完成MCU芯片性…

Vue组合式API

文章目录 Vue组合式API1. 概念1.1 传统组件1.2 组合式API 2. setup 组件 Vue组合式API 1. 概念 Vue3 组合式 API&#xff08;Composition API&#xff09; 主要用于在大型组件中提高代码逻辑的可复用性。 传统的组件随着业务复杂度越来越高&#xff0c;代码量会不断的加大&am…

Ubuntu18中NVIDIA,cuda,cudnn,pytorch安装

注意&#xff1a;nvidia驱动和cuda,cudnn,pytroch,python的对应关系 linux安装pytorch&#xff08;包括cuda与cudnn&#xff09;_linux清华园按照pytorch1.12_BryceRui的博客-CSDN博客 安装流程&#xff1a;安装cuda&#xff08;包括nvidia驱动&#xff09; cudnn python安装…

软件设计模式系列之三———工厂方法模式

1 模式的定义 工厂方法模式是一种常见的设计模式&#xff0c;属于创建型设计模式之一&#xff0c;它在软件工程中用于对象的创建。该模式的主要思想是将对象的创建过程抽象化&#xff0c;将具体对象的实例化延迟到子类中完成&#xff0c;以便在不同情况下可以创建不同类型的对…

yolov5训练ExDark数据集(附全过程代码,超详细教程,无坑!)

1.数据集获取 ExDark&#xff1a;免费下载地址 数据内容展示&#xff1a;共12个类别7363张 2.ExDark转yolo格式 ExDark的label文件内容 yolo的label文件内容 转换前准备如下 其中&#xff1a; anndir等于ExDark数据集中的Annotations文件夹&#xff0c;用于存放标签数据…