信源编码定理

✍ dations ◷ 2025-11-21 02:13:04 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 云中郡云中郡,中国古代的郡。战国时期,属赵国的一部分,由赵武灵王置。秦代治所在云中县(今内蒙古自治区托克托县东北)。辖境约是今内蒙古自治区土默特右旗以东,大青山以南,卓资县以西,黄河
  • ARP地址解析协议(英语:Address Resolution Protocol,缩写:ARP)是一个通过解析网络层地址来找寻数据链路层地址的网络传输协议,它在IPv4中极其重要。ARP最初在1982年的RFC 826(征求意
  • Cu(IOsub3/sub)sub2/sub碘酸铜是铜的碘酸盐,目前仅已知二价的化合物。向硝酸铜溶液中加入碘酸,得到一水合物晶体:碘酸铜一水合物(Cu(IO3)2·H2O)在240°C发生脱水,生成无水物。无水物继续加热至470°C,不
  • 链烷.mw-parser-output ruby>rt,.mw-parser-output ruby>rtc{font-feature-settings:"ruby"1}.mw-parser-output ruby.large{font-size:250%}.mw-parser-output ruby.larger{fon
  • 郭晓岚郭晓岚 (英语:Hsiao-Lan Kuo,1915年2月7日-2006年5月6日), 美籍华裔气象学家,大气动力学的一代宗师,芝加哥气象学派的著名人物。1915年2月7日,出生于中国河北满城县张辛庄村。因家境
  • 服装配饰服装配饰或服装配件,是指与服装相搭配的事物。而时尚饰品是时装的一种,主要为用作转换不同形象,英语fashion accessory于19世纪开始使用。普遍的时尚饰品包括手袋、耳环、皮带
  • 台中市公车历史台中市公车历史,是以年表方式描述台中市市区公车至今所发生的主要事件,以及客运路线的更动。
  • 冲击反应模式冲击反应模式,又名冲击反应理论或冲击反应论,由美国历史学家费正清提出,指中国的发展是因为西方对中国进行冲击而产生的反应。近代中国由于自给自足的封建经济和朱程理学的束缚
  • 陈之骝陈之骝(1936年-),浙江萧山人,中华人民共和国外交官,曾任中华人民共和国驻匈牙利共和国特命全权大使。
  • 异常物质在物理学中,异常物质(英语:exotic matter)指的是与普通物质不同,具有奇异特性的物质的统称。异常物质有以下几种:拥有负质量(negative mass)的一类异常物质有时译为负物质。注意这里