相对熵

✍ dations ◷ 2025-12-09 21:44:32 #概率与统计,应用数学,概率论,信息论,信息学熵

KL散度(Kullback-Leibler divergence,简称KLD),在讯息系统中称为相对熵(relative entropy),在连续时间序列中称为随机性(randomness),在统计模型推断中称为讯息增益(information gain)。也称讯息散度(information divergence)。

KL散度是两个概率分布P和Q差别的非对称性的度量。 KL散度是用来度量使用基于Q的分布来编码服从P的分布的样本所需的额外的平均比特数。典型情况下,P表示数据的真实分布,Q表示数据的理论分布、估计的模型分布、或P的近似分布。

对于离散随机变量,其概率分布 和 的KL散度可按下式定义为

等价于

即按概率求得的和的对数商的平均值。KL散度仅当概率和各自总和均为1,且对于任何皆满足 Q ( i ) > 0 {\displaystyle Q(i)>0} 和可按积分方式定义为

其中和分别表示分布和的密度。

更一般的,若和为集合的概率测度,且关于绝对连续,则从到的KL散度定义为

其中,假定右侧的表达形式存在,则 d Q d P {\displaystyle {\frac {{\rm {d}}Q}{{\rm {d}}P}}} 关于的R–N导数。

相应的,若关于绝对连续,则

即为关于的相对熵。

相对熵的值为非负数:

由吉布斯不等式可知,当且仅当 P = Q {\displaystyle P=Q} 到的距离通常并不等于从到的距离。


自信息和KL散度


互信息和KL散度


信息熵和KL散度


条件熵和KL散度


交叉熵和KL散度

相关

  • 作通格语言作通型配列(Ergative–absolutive alignment),也称为作通格配列、施通格配列、作格配列、施格配列或能格配列,是一类配列方式,即在句法或形态上,将不及物动词的单一变元和及物动词
  • 埃斯特雷马杜拉语埃斯特雷马杜拉语(Estremeñu)是一种罗曼语族语言,在西班牙的埃斯特雷马杜拉自治区使用。埃斯特雷马杜拉语通常分为三个分支(北部或“高埃斯特雷马杜拉语”——artu estremeñu,
  • 威廉颂《威廉颂》(荷兰语:Het Wilhelmus)是荷兰国歌。该曲颂赞奥兰治-拿骚亲王威廉(Willem van Oranje-Nassau),歌词成于1568~1572年间,虽然较日本国歌君之代的歌词(诗)晚了近六百年,但威廉
  • 园区网络园区网络(英语:Campus network,缩写CAN)是一个在有限的地理区域相互连接的局域网组成的 网络(交换器、 路由器)和传媒体(光学纤维、5类电缆等等)几乎由园区承租人/所有人(企业、大学
  • 改革历法历法改革是一种对日历系统的重大修正。这个词有时适用于切换至不同的日历,以取代现行的日历。大多数日历有可能改变或改革的几个规则:历史上,大多数的历法改革都是为了与天文年
  • 柱果木榄柱果木榄(学名:Bruguiera cylindrica),为红树科木榄属下的一个植物种。
  • 五台片五台片是晋语的八个片之一。主要分布在山西省北部雁门关以南,以及陕西省北部的部分地区。五台片的共同特征是只有一个入声声调,阴平与上声调值相同。太原市下辖的阳曲县一般也
  • 北京申办奥运会国际奥林匹克委员会第112次全体会议于2001年7月12日至16日在俄罗斯莫斯科召开,此次会议的主要议程包括投票产生2008年夏季奥林匹克运动会主办城市及选举第8任国际奥林匹克委
  • 约瑟夫·傅里叶让·巴普蒂斯·约瑟夫·傅里叶男爵(法语:Jean Baptiste Joseph Fourier,1768年3月21日-1830年5月16日),法国数学家、物理学家,提出傅里叶级数,并将其应用于热传导理论与振动理论,傅里
  • 上游产业 (石化产业)上游产业,又称勘探和开发产业,是石油和天然气工业的一个重要组成部分。其包括寻找潜藏在地下或水下的原油和天然气田、钻探勘探井、随后部署采油井和注水井,驱替油气并把原油和