相对熵

✍ dations ◷ 2024-09-20 13:34:20 #概率与统计,应用数学,概率论,信息论,信息学熵

KL散度(Kullback-Leibler divergence,简称KLD),在讯息系统中称为相对熵(relative entropy),在连续时间序列中称为随机性(randomness),在统计模型推断中称为讯息增益(information gain)。也称讯息散度(information divergence)。

KL散度是两个概率分布P和Q差别的非对称性的度量。 KL散度是用来度量使用基于Q的分布来编码服从P的分布的样本所需的额外的平均比特数。典型情况下,P表示数据的真实分布,Q表示数据的理论分布、估计的模型分布、或P的近似分布。

对于离散随机变量,其概率分布 和 的KL散度可按下式定义为

等价于

即按概率求得的和的对数商的平均值。KL散度仅当概率和各自总和均为1,且对于任何皆满足 Q ( i ) > 0 {\displaystyle Q(i)>0} 和可按积分方式定义为

其中和分别表示分布和的密度。

更一般的,若和为集合的概率测度,且关于绝对连续,则从到的KL散度定义为

其中,假定右侧的表达形式存在,则 d Q d P {\displaystyle {\frac {{\rm {d}}Q}{{\rm {d}}P}}} 关于的R–N导数。

相应的,若关于绝对连续,则

即为关于的相对熵。

相对熵的值为非负数:

由吉布斯不等式可知,当且仅当 P = Q {\displaystyle P=Q} 到的距离通常并不等于从到的距离。


自信息和KL散度


互信息和KL散度


信息熵和KL散度


条件熵和KL散度


交叉熵和KL散度

相关

  • 埃勒斯-当洛二氏综合征埃勒斯-当洛二氏症候群(英语:Ehlers-Danlos Syndrome,缩写为 EDS),又称皮肤弹力过度症(英语:Cutis hyperelastica)、松皮症、先天性结缔组织异常症候群,是一种遗传疾病,因胶原蛋白(第一
  • 卡卢肯贝卡卢肯贝是西非国家安哥拉的城市,由威拉省负责管辖,位于该国中部,处于首都罗安达以南约600公里,市内有天主教和基督教的教堂,2006年人口估计约246,229。
  • 尤姓尤姓是南中国的姓氏,始自10世纪,在百家姓中排第19,台湾第八十五大姓,在大陆当代姓氏中排第124位,约占大陆汉族人口的万分之六,多生活在南中国一带。按照目前大部分尤氏观点:尤姓原
  • 霍桑纳撒尼尔·霍桑(Nathaniel Hawthorne,1804年7月4日-1864年5月19日),19世纪美国小说家,其代表作品《红字》为世界文学的经典之一。霍桑出生于美国马萨诸塞州塞勒姆镇。他的曾曾祖父
  • 苯丙酮苯丙酮是一种有机化合物,为无色、有香甜气味的液体,难溶于水,和有机溶剂混溶。苯丙酮可以通过丙酸和苯的FC反应制备,它也可以通过苯甲酸和丙酸在乙酸钙与氧化铝上的ketonization
  • 时代精神运动债该死运动(The Zeitgeist Movement, TZM),旧译时代精神,由彼得・约瑟夫(英语:Peter Joseph)于2008年发起,是一个提倡永续发展的全球性草根组织,通过分布于全球/区域性的分部、专案小
  • 霞浦市霞浦市(日语:かすみがうら市/かすみがうらし  */?)是茨城县南部的一市。
  • 力钧力钧(1855年-1925年),字轩举、号医隐,福建永福人,中国近代名医。力钧早年曾师从刘善曾、陈宗备、张熙皋、朱良仙等名医。光绪三年(1877年)起独自行医授徒。光绪十五年(1889年)中举,但进
  • 阿史那贺鲁阿史那贺鲁(?-659年),西突厥汗国大将,室点密可汗五世孙,后自立为西突厥沙钵罗可汗(古突厥文:��������‬,拉丁转写:)。早年为西突厥叶护,在多罗斯川(今额尔齐斯河源头)一带游牧。646年,乙毗射匮就任
  • 固件固件(英语:firmware),是一种嵌入在硬件设备中的软件。通常它是位于特殊应用集成电路(ASIC)或可编程逻辑器件(PLD)之中的闪存或EEPROM或PROM里,有的可以让用户更新。可以应用在非常广