信源编码定理

✍ dations ◷ 2025-12-06 07:46:02 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 消化性溃疡消化性溃疡(英语:peptic ulcer disease,简称PUD),又称胃及十二指肠溃疡。这是指胃、小肠前段(十二指肠)或幽门,有时也包含了食道下端的黏膜损伤(溃疡)。在胃发生的溃疡称作胃溃疡(英语:s
  • 氢-5氢-5是氢的同位素之一,它的原子核包含了四个中子和一个质子,在实验室里用一个氚的原子核来轰炸氚,这让氚吸收两个氚原子核的中子而形成了氢-5。氢-5的半衰期非常短,只有8.01930
  • 铁砧铁砧是一种常用工具,其最简单的形式是有一个用以放置锻打物体坚硬平面的金属块。铁砧的惯性能够使锻打工具的能量转移到工件上。在大多数情况下,砧用于金属锻造方面。在现代焊
  • 希腊菜希腊饮食(希腊语:Ελληνική Κουζίνα)为典型的地中海风格,受意大利、巴尔干诸国、土耳其等国影响。广泛使用橄榄油、蔬菜、香草、谷物,以及面包、酒、鱼,各种肉类,包
  • 激光诱导击穿光谱激光诱导击穿光谱(英语:Laser-induced breakdown spectroscopy,LIBS) 技术通过超短脉冲激光聚焦样品表面形成等离子体,进而对等离子体发射光谱进行分析以确定样品的物质成分及含
  • 基底层基底层(英语:stratum basale),是表皮最深的一层。基底层由一层矮柱状或立方形的细胞组成。基底层细胞核呈卵圆形,细胞质内多粗面内质网和张力原纤维。人体皮肤的表皮和真皮表皮解
  • 近交系动物近交系动物(英语:Inbred Strain Animals)是指经过至少连续20代的、完全由同胞兄弟姐妹交配、或者亲代与子代交配而培育的、近交系数大于99%的动物品系。在近交系中,所有个体都可
  • 哭泣的玫瑰《哭泣的玫瑰》()是1997年的美国传记音乐电影,讲述了已故的著名拉丁女歌手赛琳娜的一生。影片由格雷戈里·纳瓦(英语:Gregory Nava)执导,珍妮弗·洛佩兹担任主演。
  • 弗朗茨·格拉晓夫弗朗茨·格拉晓夫(德语:Franz Grashof;1826年7月11日-1893年10月26日)是一位德国工程师。曾任卡尔斯鲁厄理工学院应用力学系教授。用于描述自然对流的格拉晓夫数即是以他之名命名
  • 奥兰多·费吉斯奥兰多·费吉斯 (英语:Orlando Guy Figes, 1959年11月20日-)是一位英国历史学家。专攻于俄罗斯历史。他也是伦敦大学伯贝克学院历史学教授。1959年出生于英国伦敦伊斯灵顿。父