交叉熵

✍ dations ◷ 2025-08-21 13:16:23 #信息学熵

在信息论中,基于相同事件测度的两个概率分布 p {\displaystyle p} 相对于的)。

对于离散分布 p {\displaystyle p} q {\displaystyle q} ,这意味着:

对于连续分布也是类似的。我们假设 p {\displaystyle p} q {\displaystyle q} 在测度 r {\displaystyle r} 上是绝对连续的(通常 r {\displaystyle r} 是Lebesgue measure on a Borel σ-algebra)。设 P {\displaystyle P} Q {\displaystyle Q} 分别为 p {\displaystyle p} q {\displaystyle q} 在测度 r {\displaystyle r} 上概率密度函数。则

在信息论中, 以直接可解编码模式通过值 x i {\displaystyle x_{i}} 编码一个信息片段,使其能在所有可能的 X {\displaystyle X} 集合中唯一标识该信息片段,Kraft–McMillan theorem确保这一过程可以被看作一种 X {\displaystyle X} 上的隐式概率分布 q ( x i ) = 2 l i {\displaystyle q(x_{i})=2^{-l_{i}}} ,从而使得 l i {\displaystyle l_{i}} x i {\displaystyle x_{i}} 的编码位长度。 因此, 交叉熵可以看作每个信息片段在错误分布 Q {\displaystyle Q} 下的期望编码位长度,而信息实际分布为 P {\displaystyle P} 。这就是期望 E p {\displaystyle {E}_{p}} 是基于 P {\displaystyle P} 而不是 Q {\displaystyle Q} 的原因。

在大多数情况下,我们需要在不知道分布 p {\displaystyle p} 的情况下计算其交叉熵。例如在语言模型中, 我们基于训练集 T {\displaystyle T} 创建了一个语言模型, 而在测试集合上通过其交叉熵来评估该模型的准确率。 p {\displaystyle p} 是语料中词汇的真实分布,而 q {\displaystyle q} 是我们获得的语言模型预测的词汇分布。由于真实分布是未知的,我们不能直接计算交叉熵。在这种情况下,我们可以通过下式来估计交叉熵:

N {\displaystyle N} 是测试集大小, q ( x ) {\displaystyle q(x)} 是在训练集上估计的事件 x {\displaystyle x} 发生的概率。我们假设训练集是从 p ( x ) {\displaystyle p(x)} 的真实采样,则此方法获得的是真实交叉熵的蒙特卡洛估计。

相关

  • CPR心肺复苏术(英语:Cardiopulmonary Resuscitation,CPR)是一种救助心搏骤停病患的急救措施,通过人工保持脑功能直到自然呼吸和血液循环恢复。心肺复苏术并非单一的技术,它包含了一系
  • 害虫有害生物(Pest)泛指所有会对人类或人类日常生活关注的物种有害的动物或植物。这些人类关注的物种可能是禽畜业、农业或林业相关的物种。家居中会对人类造成滋扰的物种亦属于“
  • 二嗪二嗪(Diazine)是含有两个氮原子的六元杂环化合物,即二氮杂苯,分子式为C4H4N2。它有以下三种异构体:受氮原子的吸电子诱导效应和吸电子共轭效应的影响,二嗪的碱性弱于吡啶,且第一个
  • 圣克鲁斯-德特内里费圣克鲁斯-德特内里费(西班牙语:Santa Cruz de Tenerife)位于西班牙加那利群岛特内里费岛上,是加那利自治区的首府之一,也是圣克鲁斯-德特内里费省的首府。根据考古的发现,圣克鲁斯
  • 洪都拉斯伦皮拉洪都拉斯伦皮拉 (发音为/lɛmˈpɪrə/,货币编号:HNL)是洪都拉斯的流通货币。辅币单位为分,1伦皮拉=100分。
  • 冻酸奶冻酸奶是用酸奶,有时候用其他乳制品制成的冷冻甜点。它通常比冰淇淋酸,脂肪也比较少 (因为使用的是牛奶而不是奶油)。它跟牛奶冻 (近几年被称之为低脂肪或轻冰淇淋)和常见的霜淇淋
  • 黄坤玄黄坤玄(1978年4月15日-),台湾演员,童星出身。
  • 2019年德里火灾2019年德里火灾 可以指:
  • 安德烈亚斯·塞拉里乌斯安德烈亚斯·塞拉里乌斯(拉丁语:Andreas Cellarius,约1596年-1665年)是一位生于德国的荷兰地图学家,最有名的作品是星图《和谐大宇宙》(Harmonia Macrocosmica),该星图由约翰内斯·扬
  • 外人 (日语)“外人”是日文中的一个词语,通常认为是“外国人”的俗语、略语。但无论语源还是在现代语的用法中都与“外国人”不同。相较于“外国人”,该词常含有否定意味,且多指特定人种,也