相对熵

✍ dations ◷ 2025-05-17 20:09:18 #概率与统计,应用数学,概率论,信息论,信息学熵

KL散度(Kullback-Leibler divergence,简称KLD),在讯息系统中称为相对熵(relative entropy),在连续时间序列中称为随机性(randomness),在统计模型推断中称为讯息增益(information gain)。也称讯息散度(information divergence)。

KL散度是两个概率分布P和Q差别的非对称性的度量。 KL散度是用来度量使用基于Q的分布来编码服从P的分布的样本所需的额外的平均比特数。典型情况下,P表示数据的真实分布,Q表示数据的理论分布、估计的模型分布、或P的近似分布。

对于离散随机变量,其概率分布 和 的KL散度可按下式定义为

等价于

即按概率求得的和的对数商的平均值。KL散度仅当概率和各自总和均为1,且对于任何皆满足 Q ( i ) > 0 {\displaystyle Q(i)>0} 和可按积分方式定义为

其中和分别表示分布和的密度。

更一般的,若和为集合的概率测度,且关于绝对连续,则从到的KL散度定义为

其中,假定右侧的表达形式存在,则 d Q d P {\displaystyle {\frac {{\rm {d}}Q}{{\rm {d}}P}}} 关于的R–N导数。

相应的,若关于绝对连续,则

即为关于的相对熵。

相对熵的值为非负数:

由吉布斯不等式可知,当且仅当 P = Q {\displaystyle P=Q} 到的距离通常并不等于从到的距离。


自信息和KL散度


互信息和KL散度


信息熵和KL散度


条件熵和KL散度


交叉熵和KL散度

相关

  • 相位相位(英文:phase),是描述信号波形变化的度量,通常以度(角度)作为单位,也称作相角或相。当信号波形以周期的方式变化,波形循环一周即为360º。常应用在科学领域,如数学、物理学、电学等
  • 赵进东赵进东(1956年11月-),生于重庆,原籍江苏武进,中国植物生理学及藻类学家,北京大学生命科学学院教授。1956年生于重庆,原籍江苏武进。1982年毕业于西南师范大学,1990年在美国德克萨斯大
  • 英国国民保健署国民医疗服务体系(英语:National Health Service,简称NHS),是对英国以下四大公型医疗系统的统称:国民医疗服务体系的经费主要来自全国中央税收,用以向公众提供一系列的医疗保健服务
  • 雅虎新闻雅虎新闻(英语:Yahoo! News)是一个美国新闻网站,最初是基于雅虎的新闻聚合服务而建立。该站点最早由雅虎软件工程师布拉德·克劳斯易(Brad Clawsie)于1996年8月开发完成,而最初的文
  • 巴西野鸟巴西在生物地理分区上属于新热带区,约有1700种鸟类被记录,其中约57%为巴西特有种。是世界上鸟种第三多的国家,仅次于哥伦比亚和秘鲁。
  • 卞赵如兰卞赵如兰(英语:Rulan Chao Pian,1922年4月19日-2013年11月30日),东方语文与中国音乐博士,哈佛大学荣休教授 。赵元任和杨步伟之长女。与丈夫卞学
  • 211工程211工程(英语:Project 211),俗称“211院校”,是指1990年代起,中华人民共和国政府针对中国高等教育发展所策划、实行的一项战略性政策。“211”的含义是“面向21世纪、重点建设100
  • 安禄山安禄山(703年2月19日-757年1月30日),本姓康,名轧荦山,营州柳城(今辽宁省朝阳市)人。母阿史德氏。父为昭武九姓的粟特人,母为突厥巫师,信仰祆教。安禄山是唐代藩镇割据势力之一的最初建
  • 质量百分浓度 质量百分浓度又称重量百分浓度,缩写wt%,是一种表示混合物中特定物质浓度的方法,是特定物质的质量 m i
  • 狗不理包子狗不理始于清朝咸丰年间(1858年),由直隶省武清县下朱庄人高贵友创始,高贵友乳名叫“狗子”,他自幼居于天津,在当时南运河畔的刘家蒸吃铺做帮工和学徒,高贵友用3年掌握做包子和其他