信源编码定理

✍ dations ◷ 2025-11-29 12:56:31 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 凯尔苏斯凯尔苏斯(英语:Aulus Cornelius Celsus),(前25年-50年)。生于提比略统治时期(公元14年至公元37年)。他著有一部涵盖多种主题的百科全书,前5卷与农业相关,但现仅存关于医学的八卷,被称为
  • pH计pH计是一种用于测量液体的pH值的电子仪器(也有特殊的探针来测量半固体物质),可以确认物质的酸碱性。一个典型的pH计由一个特殊的测量探头〔玻璃电极(glass electrode)〕连接到电
  • 朱铭美术馆坐标:25°14′47″N 121°36′41″E / 25.24629°N 121.61128°E / 25.24629; 121.61128朱铭美术馆(英语:Juming Museum)由艺术家朱铭 (Ju Ming)于1999年9月19日正式成立,是台湾最
  • 森林破坏森林砍伐,或称森林开伐、去森林化(Deforestation)、森林破坏,意为人为的将森林地转成耕地、牧场、城市等用地的行为。一般来说,森林开伐会造成环境退化和物种多样性的减少。许多
  • 线粒体16S rRNA线粒体16S RNA是一种存在于线粒体核糖体(mitoribosome,MR)39S核糖体亚基中的rRNA。在人类细胞的线粒体中,该rRNA由MT-RNR2基因编码。MT-RNR2基因还同时编码了能抑制阿尔茨海默症
  • 道达尔道达尔(Total,Euronext:FP, NYSE:TOT)是一家法国石油公司,为目前世界六大石油公司之一,同时也是欧洲市值最大的公司之一。其经营范围涵盖了整个石油和天然气的产业链,从原油和天然气
  • 约翰·施特劳斯约翰·巴普蒂斯特·施特劳斯(德语:Johann Baptist Strauss,1825年10月25日-1899年6月3日),因与其父同名,故通常称为约翰·施特劳斯二世或小约翰·施特劳斯,奥地利作曲家,以圆舞曲作品
  • 纛岛游园地站纛岛游园地站(朝鲜语:뚝섬유원지역/뚝섬遊園地驛  */?)是一个位于首尔特别市广津区紫阳3洞(朝鲜语:자양동 (서울))与紫阳4洞边界,属于首尔地铁7号线的地铁站。纛岛游园区位于车站
  • 弗里德里希·艾伯特·朗格弗里德里希·阿尔伯特·朗格(德语:Friedrich Albert Lange,1828年9月28日-1875年11月23日),德国的新康德主义哲学家和社会主义者。他在杜伊斯堡、苏黎世、波恩接受过教育,在那里他
  • 哈米尼干哈米尼干,是一个蒙古化的鄂温克人部落,也是蒙古国唯一一个通古斯民族,他们在16世纪早期成为喀尔喀蒙古的贡民。他们最早生活在尼布楚,后来俄罗斯哥萨克和布里亚特人占领了他们的