相对熵

✍ dations ◷ 2025-12-08 01:07:18 #概率与统计,应用数学,概率论,信息论,信息学熵

KL散度(Kullback-Leibler divergence,简称KLD),在讯息系统中称为相对熵(relative entropy),在连续时间序列中称为随机性(randomness),在统计模型推断中称为讯息增益(information gain)。也称讯息散度(information divergence)。

KL散度是两个概率分布P和Q差别的非对称性的度量。 KL散度是用来度量使用基于Q的分布来编码服从P的分布的样本所需的额外的平均比特数。典型情况下,P表示数据的真实分布,Q表示数据的理论分布、估计的模型分布、或P的近似分布。

对于离散随机变量,其概率分布 和 的KL散度可按下式定义为

等价于

即按概率求得的和的对数商的平均值。KL散度仅当概率和各自总和均为1,且对于任何皆满足 Q ( i ) > 0 {\displaystyle Q(i)>0} 和可按积分方式定义为

其中和分别表示分布和的密度。

更一般的,若和为集合的概率测度,且关于绝对连续,则从到的KL散度定义为

其中,假定右侧的表达形式存在,则 d Q d P {\displaystyle {\frac {{\rm {d}}Q}{{\rm {d}}P}}} 关于的R–N导数。

相应的,若关于绝对连续,则

即为关于的相对熵。

相对熵的值为非负数:

由吉布斯不等式可知,当且仅当 P = Q {\displaystyle P=Q} 到的距离通常并不等于从到的距离。


自信息和KL散度


互信息和KL散度


信息熵和KL散度


条件熵和KL散度


交叉熵和KL散度

相关

  • 太极太极是中国思想史上的重要概念,主要继承自《周易》:“易有大恒,是生两檥。两檥生四马,四马生八卦。”(马王堆出土本),故改“恒”为“极”,而四马同时改为四象。“太”与“大”古时相
  • 麻部,为汉字索引中的部首之一,康熙字典214个部首中的第二百个(十一划的则为第六个)。就繁体和简体中文中,麻部归于十一划部首。麻部只以上方为部字。且无其他部首可用者将部首归
  • 取代反应取代反应(英语:Substitution reaction)是一种重要的有机化学反应,其定义是分子中的一个原子或原子团被其他原子或原子团取代。而取代反应主要依照反应中所使用的试剂分为亲核取
  • 千禧中国鸟龙中国鸟龙属(属名:Sinornithosaurus,意为“中国的鸟蜥蜴”),是种驰龙科的有羽毛恐龙,化石发现于中国的义县组,年代为下白垩纪的中巴列姆阶。中国鸟龙是第五个发现的有羽毛恐龙,并且在
  • 沙池沙池是一个装载沙的范围,可作为游戏或跳远之用。较小的又叫沙盒。《田径竞赛规则》第四节B部分第一百八十四条第六及第七款: 落地区宽度最小2.75米,最大3米。助跑道应对准落地
  • 鲁道夫·朱利安尼鲁道夫·威廉·路易斯·“鲁迪”·朱利安尼,KBE(英语:Rudolph William Louis "Rudy" Giuliani,1944年5月28日-)是美国律师、检察官、商人及共和党的美国政治人物,出身于纽约州。朱
  • 汪荣祖汪荣祖(1940年3月7日-),原籍安徽旌德,生于上海,长于台湾。国立台湾大学历史学系毕业,美国西雅图华盛顿大学历史学博士,萧公权之学生。2003年2月任国立中正大学讲座教授。2008年任国
  • 圆桌会议圆桌会议指围绕圆桌举行的会议,圆桌会议并无主席位置,亦无随从位置,旨在人人平等。此概念源自英国传说里的亚瑟王与其圆桌骑士在卡美洛时代的习俗。现在通常会在多党派会谈时举
  • 毛利氏大江系毛利氏是日本氏族,原姓大江。是镰仓时代大江广元四男大江季光的后代。最初在越后国生活。后来迁往至安艺国。从国人成为了大名,最兴盛的时代曾统领达七国。在关原之战后
  • 鲕粒灰岩鲕粒灰岩(英文:Oolite),又称鸡蛋石(Egg stone)是一种鲕粒(英语:Ooid)(由同心层组成的球粒)。其名字源于希腊语boion的鸡蛋。严格的说鲕粒岩是由直径为0.25至2mm的鲕粒组成,而颗粒大于2mm