信源编码定理

✍ dations ◷ 2025-12-02 01:29:15 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 黄体制剂黄体制剂(英语:Progestin)是一种合成的孕激素,与孕酮有类似效果。Progestin的两种最重要用途为激素避孕(英语:Hormonal contraception)(独立或与雌激素一同使用)以及作为激素替代疗法
  • 潘氏细胞潘氏细胞(或称帕内特细胞、Paneth cells、PCs)是起源于肠隐窝干细胞的小肠腺特征性细胞,与隐窝干细胞间隔排列于小肠腺的底部,并且遍布于整个小肠。胞体呈锥体形,胞质顶部的粗大
  • 皮肤色素皮肤划痕症,又称为人工荨麻疹,是皮肤病的一种,通常患者也有湿疹,属于荨麻疹的一种类型。常见的皮肤划痕症有两种,分别是“单纯性皮肤划痕症”和“症状性皮肤划痕症”。“单纯性
  • 加勒比共同体有15个正式成员:有5个准成员(都是英国海外领地):有8个观察员:加勒比共同体(CARICOM)是15个加勒比国家所建立的组织。加勒比共同体的主要目的是促进经济一体化和其成员之间的合
  • 南汉山城南汉山城(韩语:남한산성)位于首尔东南方约25公里的广州市中部面山城里,南汉山城海拔约480米,与京畿道广州市、河南市以及城南市的山脊相连,以达到最大的军事防御能力。城郭长达12
  • 乔斯·穆雷尔乔斯·穆雷尔(1530年8月14日或9月14日-1580年10月14日)是瑞士苏黎世的一位诗人、地形学家、彩色玻璃制造商和数学家。他的几件彩色玻璃作品现藏于瑞士国家博物馆。
  • 1,12-二碳代-闭式-十二硼烷(12)1,12-二碳代-闭式-十二硼烷(12)是一种碳硼烷,化学式为C2B10H12,它是非极性分子。1,12-C2B10H12对氧化剂和还原剂稳定。它在无水氟化氢中和氟气反应,生成氟代衍生物C2H2B10F10,其
  • 黄锡璆黄锡璆(1941年5月19日-),籍贯广东梅县,东南大学和天主教鲁汶大学毕业,中国共产党党员,中国大陆建筑学家、北京建筑工程学院、北京工业大学、东南大学兼职教授。黄锡璆是国际建筑师
  • 林存林存,字以道,福州闽县(今福建省福州市)人。南宋大臣,宋理宗时权参知政事。林存师从于真德秀,宋理宗端平二年(1235年)中进士,嘉熙二年(1238年),以词科,至试尚书吏部侍郎。历任中书舍人,兼直
  • 江户四大饥荒江户四大饥荒,为日本江户时代因为长期的寒害、干旱、水灾等天气异常与虫害、火山爆发等原因而长期欠收造成的饥荒中最严重的四次。通常被称为四大饥荒的为以下四者。另外也常