信源编码定理

✍ dations ◷ 2025-11-20 13:32:30 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 瓦登伯革氏症候群瓦登伯革氏症候群(英语:Waardenburg syndrome)是一种罕见的遗传性疾病,首次发现于1951年。常见病征为不同程度的耳聋、两眼眼距较宽、鼻根宽阔、头发中杂有一撮白发,以及出现虹膜
  • 鲸鱼座τe鲸鱼座τe(Tau Ceti e),即天仓五e,是一颗尚未确认的太阳系外行星,母恒星是类似太阳的鲸鱼座恒星天仓五,距离地球约11.905光年,是距离母恒星第四远的行星。鲸鱼座τe 和天仓五的其他
  • 10月29日10月29日是阳历一年中的第302天(闰年第303天),离全年的结束还有63天。
  • 亚洲国家GDP列表这是一份按字母顺序排列的亚洲国家GDP列表,以2016年国际货币基金组织国内生产总值实际数据和估计数据为主。领土 单位是百万美元美元单位是国际元单位是国际元
  • 德国联邦教育与研究部联邦教育与研究部(德语:Bundesministerium für Bildung und Forschung,BMBF)是德国联邦政府机构之一,总部设于波恩,柏林设有第二办公室。联邦教育与研究部提供资金给研究计划与机
  • 印度人诺贝尔奖得主列表印度人诺贝尔奖得主系指印度人、海外印度人、印度出生者或定居于印度身份的诺贝尔奖得主。迄2019年,已有13名印度人获得诺贝尔奖:
  • Echo (架构)Echo是NextApp公司开发的一个Web应用框架,用于建构基于Web Ajax的应用程序,其接口经过更新DOM实现。
  • 楠木正成楠木正成(?-1336年7月4日),幼名多闻丸,明治时代起尊称大楠公,为镰仓幕府末期到南北朝时期著名武将。楠木正成一生竭力效忠后醍醐天皇,在凑川之战阵殁。后世以其为忠臣与军人之典范,被
  • 海芋“海芋”,港澳称为“海芋”,台湾称为“兰屿姑婆芋”(学名:),为天南星科海芋属植物,是常见观赏植物,原出东南亚及澳洲原始森林,亦见诸华南及兰屿等地,有多个俗称,如,痕芋头、狼毒(广东)、野
  • 银行准备银行准备(英语:bank reserve),又称存款准备金,是金融机构为了保障客户能够提取存款和保持足够资金作清算,而准备存放在中央银行的存款。在许多国家,中央银行会制定银行存款准备金比