交叉熵

✍ dations ◷ 2025-06-29 17:36:49 #信息学熵

在信息论中,基于相同事件测度的两个概率分布 p {\displaystyle p} 相对于的)。

对于离散分布 p {\displaystyle p} q {\displaystyle q} ,这意味着:

对于连续分布也是类似的。我们假设 p {\displaystyle p} q {\displaystyle q} 在测度 r {\displaystyle r} 上是绝对连续的(通常 r {\displaystyle r} 是Lebesgue measure on a Borel σ-algebra)。设 P {\displaystyle P} Q {\displaystyle Q} 分别为 p {\displaystyle p} q {\displaystyle q} 在测度 r {\displaystyle r} 上概率密度函数。则

在信息论中, 以直接可解编码模式通过值 x i {\displaystyle x_{i}} 编码一个信息片段,使其能在所有可能的 X {\displaystyle X} 集合中唯一标识该信息片段,Kraft–McMillan theorem确保这一过程可以被看作一种 X {\displaystyle X} 上的隐式概率分布 q ( x i ) = 2 l i {\displaystyle q(x_{i})=2^{-l_{i}}} ,从而使得 l i {\displaystyle l_{i}} x i {\displaystyle x_{i}} 的编码位长度。 因此, 交叉熵可以看作每个信息片段在错误分布 Q {\displaystyle Q} 下的期望编码位长度,而信息实际分布为 P {\displaystyle P} 。这就是期望 E p {\displaystyle {E}_{p}} 是基于 P {\displaystyle P} 而不是 Q {\displaystyle Q} 的原因。

在大多数情况下,我们需要在不知道分布 p {\displaystyle p} 的情况下计算其交叉熵。例如在语言模型中, 我们基于训练集 T {\displaystyle T} 创建了一个语言模型, 而在测试集合上通过其交叉熵来评估该模型的准确率。 p {\displaystyle p} 是语料中词汇的真实分布,而 q {\displaystyle q} 是我们获得的语言模型预测的词汇分布。由于真实分布是未知的,我们不能直接计算交叉熵。在这种情况下,我们可以通过下式来估计交叉熵:

N {\displaystyle N} 是测试集大小, q ( x ) {\displaystyle q(x)} 是在训练集上估计的事件 x {\displaystyle x} 发生的概率。我们假设训练集是从 p ( x ) {\displaystyle p(x)} 的真实采样,则此方法获得的是真实交叉熵的蒙特卡洛估计。

相关

  • 细胞内寄生物细胞内寄生物(英语:Intracellular parasite)是指一类寄生于宿主细胞中生长、繁殖的生物,可分为兼性(Facultative)和专性(Obligate)寄生物。部分细胞内寄生物会导致相关疾病的发生。
  • 保罗·朗之万保罗·朗之万(法语:Paul Langevin,1872年1月23日-1946年12月19日),法国物理学家,主要贡献有朗之万动力学及朗之万方程。朗之万出生于巴黎,曾就读于巴黎高等物理化工学院及巴黎高等师
  • 异柠檬酸异柠檬酸(英语:Isocitric acid)是质子化了的异柠檬酸盐,是三羧酸循环中的一个酶作用物。异柠檬酸是在乌头酸酶的酶促反应下由柠檬酸生成的,在异柠檬酸脱氢酶的作用下形成草酰琥珀
  • 楯齿龙目楯齿龙目(Placodontia)又名盾齿龙目、齿龙目,意思为"块状的牙齿",是群生存于三叠纪的海生爬行动物,在三叠纪-侏罗纪灭绝事件中灭绝。一般认为它们跟鳍龙超目有接近亲缘关系,而鳍龙类
  • 静摩擦力静摩擦力是当相互接触的两个物体相对静止,但是存在着相对运动的趋势时,在接触面之间会产生一个阻碍相对运动的力,这个力就是静摩擦力。静摩擦力的方向和相对运动趋势的方向相反
  • 柯尼赛格柯尼赛格汽车公司(Koenigsegg Automotive AB)是一家总部位于恩厄尔霍尔姆(Ängelholm)于1994年成立的瑞典小型手工打造超级跑车制造厂,是由现任的执行总裁克里斯·冯·柯尼赛格(瑞
  • 时事通信社时事通信社(日语:時事通信社/じじつうしんしゃ  */?)是日本的通讯社之一,成立于1945年11月1日,由原同盟通信社的经济报导部门分割而来。总部位于东京银座,在日本国内有78个分部,在
  • 半分桥半分桥是爱尔兰首都都柏林的一处著名地标,横跨分隔都柏林南北的利菲河。半分桥原名威灵顿桥,原以纪念威灵顿公爵于1815年于滑铁卢战役中击败拿破仑的军队。后来,这条桥被官方易
  • 蓝皮书计划蓝皮书计划(英语:Project Blue Book)是美国空军为调查不明飞行物(UFO)而成立的研究计划。成立于1952年,于1969年12月被命令终止,但持续活动到1970年1月。1947年美国兴起了一阵“飞
  • DesignstarDesignstar是模块化的开发板,类似于Arduino的硬件扩展模块,使用C语言进行开发。Designstar是模块开发板集合,拆分过的开发板模块配备双排20个插针,模块之间可叠加,与MCU可以兼容