信源编码定理

✍ dations ◷ 2025-12-07 16:06:41 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 古典学派犯罪学(英语:Criminology)是一门社会科学,主题是寻找犯罪行为的现象与规律,寻找犯罪发生的原因,借此寻找方法以减轻犯罪对社会的影响(最后这项于今日已被更精致地分科为刑事政策,而
  • 码头风云《码头风云》(英语:On the Waterfront,又译《岸上风云》、《在江边》)。是一部于1954年上映的美国犯罪电影,反映了1950年代初期纽约港各种势力互相斗争的情形。导演伊利亚·卡赞,
  • 蔡而烜蔡而烜,福建漳浦县人,清朝政治人物,同进士出身。顺治十五年(1658年)戊戌科进士,授桐柏县知县。
  • 东普鲁士东普鲁士(德语:Ostpreußen;立陶宛语:Rytų Prūsija或Rytprūsiai;波兰语:Prusy Wschodnie;俄语:Восточная Пруссия)是普鲁士王国及后来德意志帝国的一个省,位于普鲁
  • 两宗爆炸波士顿马拉松爆炸案是一件发生于2013年4月15日北美东部时间下午2时50分的爆炸事件,发生地点位在美国马萨诸塞州波士顿科普里广场。有两枚IED土制炸弹分别于终点线附近观众区
  • 核黄素激酶结构 / ECOD结构 / ECOD核黄素激酶(英语:riboflavin kinase,EC 2.7.1.26)是一个催化以下化学反应的酶:该酶催化的反应的底物为ATP和核黄素,产物是ADP和黄素单核苷酸(FMN)。但是,在古
  • 数据链接数据链接(又称:“链接数据”、“键连数据”,英文: Linked Data)在计算 (计算机科学),是一种发布“结构化数据”链接的方法,使数据间彼此相互链接。同时透过语义查询. 使链接的数
  • 仓景愉仓景愉,原名景恬,字少坪,河南中牟人。清朝政治人物。道光十八年(1838年)戊戌科进士。选翰林院庶吉士,散馆授编修。官至云南布政使。
  • 王人博王人博,(1958年-),中国著名宪法学者,山东莱西人。1979年进入西南政法学院法律系学习,1983年获法学学士学位,后留校任教,在西南政法学院(后改名为西南政法大学)执教长达19年。1986年在母
  • 楠阳路楠阳路(Nanyang Rd.)为北高雄市东西向的主要道路之一,全线位于楠梓区境内。西起加昌路,途中经楠阳高架桥以立体交叉方式接台1线高楠公路及楠梓陆桥,东至兴西路接国道一号楠梓交流