信源编码定理

✍ dations ◷ 2025-11-26 14:39:54 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 呈递交叉呈递是特定抗原呈现细胞吞噬并利用MHC I呈现外来抗原给细胞毒性T细胞的能力。交叉致敏,是交叉呈递后的结果,其描述的是透过交成呈递而使初始T细胞(英语:Naive T cell)变成活
  • 国民经济部门经济部门或经济成分通常可按如下方法分为三个部门:到了20世纪,经济学家开始认为,传统的三级服务可以进一步区分出“第四产业”和“第五产业”的服务业部门。第四产业部门的经济
  • 肾单位肾单位又称肾元(英语:Nephron),是肾制造尿液的基本功能单位,人体的肾脏中,约含200万个肾单位,每一个肾单位是由肾小体和肾小管所组成,肾小体包含肾丝球(glomerulus)和鲍氏囊(Bowman's c
  • 亨利三世 (法兰西)亨利三世(Henri III,原名:亨利·亚历山大(Henri Alexandre),1551年9月19日-1589年8月2日)法国瓦卢瓦王朝国王(1574年—1589年在位)。亨利二世第四子,母为凯瑟琳·德·麦第奇。生于枫丹
  • 小查和寇弟的顶级邮轮生活《小查和寇弟的顶级邮轮生活》(The Suite Life On Deck, 简称TSLOD)为美国情境喜剧,也是迪士尼原创剧集《小查与寇弟的顶级生活》(The Suite Life of Zack And Cody)的续作兼姊
  • 丽兹·卡潘丽兹·卡潘(英语:Lizzy Caplan, 1982年6月30日-)是一名美国女演员和模特儿。曾参演《贱女孩》、《苜蓿地》、《热浴盆时光机(英语:Hot Tub Time Machine)》、《伴娘HOLD不住》和《惊
  • 巴蒂斯塔·乔万尼·瓜里尼巴蒂斯塔·乔万尼·瓜里尼(英语:Giovanni Battista Guarini),(1538年-1612年),文艺复兴时期欧洲诗人。他出生于费拉拉,是效力于埃斯特宫廷的诗人和剧作家,他的田园剧《忠实的牧羊人》(1
  • 白云湖 (广州)广州的白云湖位于中国广州市中心城区西北部,是广州市治水重点项目之一。工程由广和泵站、引水渠、白云湖、石井河泵站(船闸)等水利工程组成。主要设计功能为调水补水、区域雨
  • 洪声洪声(1893年-1958年2月20日),字壮猷。辽北省西丰县人。民国37年(1948年)在辽北省选区当选第一届立法委员
  • 操作系统历史年表本条目为计算机操作系统从1960年至今的历史年表,若要得知电脑整体的历史,请看计算机硬件历史。DragonFly BSD 5.0Fedora 27DragonFly BSD 5.2Fedora 29FreeBSD 12.0