信源编码定理

✍ dations ◷ 2025-12-07 03:47:02 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 陈定信陈定信(1943年7月6日-),非博士出身的国立台湾大学医学院院长,一路从医师做到医学院院长,为中央研究院院士,并于2005年获选为美国国家科学院外籍院士。陈定信早年跟随宋瑞楼教授研究
  • 瑞典计算机科学研究所瑞典计算机科学研究所(英语:Swedish Institute of Computer Science,SICS),非盈利独立研究机构,以计算机科学研究为主。位于瑞典斯德哥尔摩希斯塔,由瑞典政府与瑞典工业界共同出资,
  • 泡沫红茶泡沫红茶、泡沫绿茶,是源自于台湾特有的饮品,特色在于将红茶(或绿茶)加上果糖糖浆后放在调酒器中和冰块一起摇匀,在摇的过程中会产生细致的泡沫,故称为泡沫红茶(泡沫绿茶)。泡沫红茶
  • 乌干达政治乌干达是一个总统制共和国家。立法权属于乌干达政府和乌干达议会。该制度建立在民主议会制度基础上,对18岁以上的所有公民普选。经济学人信息社将乌干达在2016年的民主指数评
  • 常丁求常丁求(1967年-),湖南省衡阳县金兰镇泉溪村人,中国人民解放军空军中将。1984年通过招飞入伍,进入飞行基础学校学习。历任空军部队飞行大队长(1996年)、空军航空兵某飞行团团长(2000年
  • 国际地球物理年国际地球物理年(法语:Année géophysique internationale,英语:International Geophysical Year,简称IGY)是1957年7月1日至1958年12月31日期间的一项跨国科学计划。它结束了东方
  • 巴西咖啡产业巴西咖啡产业产量约占世界总量的三分之一,是目前世界上最大的咖啡生产国。巴西全国境内的咖啡种植园合共占地约27000平方公里,主要分布在巴西东南部的米纳斯吉拉斯州、圣保罗
  • 无国界译者无国界译者(英语:Translators without Borders)是一个非营利的协会,旨在提供无偿公益性(英语:pro bono)的人道非营利的翻译服务。创建于2010年,原是1993年由Lexcelera(前身为Eurotext
  • 路薏丝·斐莉路薏丝·斐莉 (于 1951 年 4 月 12 日,出生于新泽西州) 是一位意大利裔的美国平面设计师,公认“俱备精湛的手艺,优雅的排版技巧,设计大胆专注,让每个设计师都钦羡不已。”她热衷
  • 圣诞忆旧集《圣诞忆旧集》(英语:A Christmas Memory),出版于1966年,是美国作家杜鲁门·卡波蒂所写的一部以20世纪30年代的阿拉巴马乡村为背景的短篇小说。《圣诞忆旧集》的故事关于一个小男