信源编码定理

✍ dations ◷ 2025-11-25 19:41:50 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 尿苷尿苷(Uridine)是一种属于核苷的化合物,由尿嘧啶与核糖(呋喃核糖)环组成,两者由β-N1-配糖键相连。
  • 贫化铀贫铀,也称为贫化铀或耗乏铀或衰变铀等等,英文简写为DU,是一种主要由铀-238构成的物质,为核燃料制程中的的副产物,故也是一种核废料。自然界中的铀,含有约99.27%的铀-238、0.72%的
  • 异戊酸血症异戊酸血症是一种遗传病,其会导致白胺酸无法正常代谢,最后导致3-甲基丁酸的堆积。此遗传病的发生率未知。遗传方面,其遗传方式为体染色体隐性遗传。医学导航:遗传代谢缺陷代谢、
  • 无颔类无颌总纲(学名:Agnatha)是脊索动物下的其中一个总纲。该纲动物是无成对偶肢和上下颌的低等脊椎动物。本纲动物生活于淡水和海水中,有些种类会回游。大多数鱼类的嘴具有铰合的双
  • 罗伯特·贝内特·福布斯罗伯特·贝内特·福布斯 (Robert Bennet Forbes,1804年9月18日-1889年11月23日),是一位船长、在华商人和船东。他积极参与造船、海上安全、鸦片贸易和慈善活动,包括向爱尔兰提供粮
  • 蔡吉人蔡吉人(1935年7月15日-),江苏苏州人,信息处理技术专家,中国工程院院士。1997年,获选中国工程院信息与电子工程学部院士。
  • 尼古拉·基里洛维奇·安季波夫尼古拉·基里洛维奇·安季波夫(俄语:Николай Кириллович Антипов,1894年12月3日(15日)-1938年7月29日)他是彼得格勒契卡主席、全联盟共产党(布尔什维克)中央
  • 花样滑冰分数排名 (2018-19赛季开始)以下花样滑冰分数排名是在为国际滑联裁判系统(ISU Judging System)下得分,该系统于2004年取代了原有的6.0评分系统,也将2018-19赛季前的分数排名化为历史。从2018-19赛季开始的
  • 德姬德姬(1559年-1636年),织田信长之女,原名织田五德。德姬的生母为信长侧室生驹吉乃,因此德姬与织田信忠、织田信雄皆同母所生。人称冈崎殿。桶狭间之战过后,德川家独立,并且与织田家友
  • 青山雪菜青山雪菜(あおやま ゆきな、1983年12月14日-)是日本的AV女优。出身于日本东京都。身高:158公分。兴趣:购物。2006年にAVデビュー。