信源编码定理

✍ dations ◷ 2025-09-17 17:05:43 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 吉西他滨吉西他滨(英语:Gemcitabine),是用于化学疗法的人工合成胞嘧啶核苷衍生物,具有放射增敏作用强,毒副作用较小的特点。礼来公司的注册商品名为健择(Gemzar)。结构是去氧胞苷2'碳上的氢
  • 同济大学医学院2000年,原上海铁道大学与同济大学合并。成立新的同济大学医学院,重建医科。于是,中国出现了两个使用“同济”品牌的医学院,上海的同济大学医学院和武汉的华中科技大学同济医学院
  • 空想社会主义空想社会主义(英语:utopian socialism)(德语:utopischer Sozialismus 或 Frühsozialismus),准确的译法为乌托邦社会主义,不过“空想”这种中文译法,在清末民初报刊上即出现过,是从日
  • 马匹马(学名:Equus ferus caballus),广泛分布于世界各地,原产于中亚草原,6000多年前就被人类驯养,最早的马匹驯养遗址于乌克兰草原发现,15世纪后,才被欧洲殖民者带到美洲和澳洲地区。马耳
  • 矩阵力学矢量 · 矢量空间  · 行列式  · 矩阵标量 · 矢量 · 矢量空间 · 矢量投影 · 外积 · 内积 · 数量积 · 向量积矩阵 · 行列式 · 线性方程组 · 秩 · 核 · 迹
  • 制桶制桶(英语:cooperage)是通过木材、钢铁、塑料等材料制造和修理桶的行业。早期制桶业主要使用木材,制造木桶以盛放和存储谷物、食物和酒类等。制桶者被称为桶匠(cooper,最早源于拉
  • 中台湾大学系统中台湾大学系统(Mid-Taiwan University System, 简称 M6),由中国医药大学、中山医学大学、东海大学、逢甲大学、静宜大学、亚洲大学等六所中部私立大学于2012年6月10日成立,是台
  • 中铁科学研究院中铁科学研究院有限公司,注册地位于成都,隶属于中国铁路工程集团的上市公司中国中铁。业务性质为勘察、设计、监理咨询。2017年,公司总资产15.89亿元,净资产7.36亿元,净利润0.42
  • 尼泊尔共产党 (普什帕·拉尔)尼泊尔共产党(尼泊尔语:नेपाल कम्युनिष्ट पार्टी),通称尼泊尔共产党 (普什帕·拉尔),是尼泊尔的一个已不存在的共产主义政党,建立者是普什帕·拉尔·什雷斯
  • 雨宫谅雨宫谅(1980年-),日本轻小说作家。出身于爱媛县。代表作是2008年1月至3月播出同名电视动画的《死后文》。2003年,以短篇《おじいちゃんの宝箱》参加电击文库(MediaWorks/ASCII Medi