信源编码定理

✍ dations ◷ 2025-12-02 08:41:12 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 罗氏制药有限公司罗氏(德语:F. Hoffmann-La Roche AG,简称Roche),总部位于瑞士巴塞尔的跨国医药研发生产商。它始创于1896年,现属于罗氏控股股份有限公司。罗氏于2009年3月26日以大约468亿美元完成
  • 下鼻甲下鼻甲(Inferior nasal concha)有二块,呈卷曲样,形成鼻腔外侧壁的一部分。他们与上鼻甲及中鼻甲担任相同的功能,允许空气进入肺以前的循环及过滤作用。然而下鼻甲是独立的骨骼,
  • 小毛毡苔小毛毡苔(学名:Drosera spatulata)又名匙叶茅膏菜、宽苞茅膏菜,在分类学上属于茅膏菜科中的茅膏菜属之下,是一种食虫植物。拉丁学名描述的是其叶形。主要分部于亚太地区,北至日本;
  • 宝儿权珤雅(朝鲜语:권보아/權珤雅 Kwon Bo-a,常被写为权宝雅;1986年11月5日-),以艺名宝儿(韩语:보아,日语:ボア,英语:BoA)为人熟知,是一名韩国女歌手、舞者和词曲作家,与李孝利、张娜拉并列第一
  • 参加第七届亚运会第七届亚洲运动会于1974年9月1日至16日在伊朗帝国首都德黑兰举行,这是第一次在中东地区举行的亚运会。本届亚运会规模之大,范围之广,参加人数之多,超过了历届亚运会。本届亚运会
  • 塞纳-瓦兹省塞纳-瓦兹省(法语:Département de la Seine-et-Oise)是法国历史上的一个省份,编号78,得名于塞纳河与瓦兹河。该省设立于1790年,是最早设立的83个省份之一。所辖区域是此前法兰西
  • 分子运动论分子运动论(英语:kinetic theory of gases,又称气体动力论)是描述气体为大量做永不停息的随机运动的粒子(原子或分子,物理学上一般不加区分,都称作分子)。快速运动的分子不断地碰撞
  • 煤气灯下《煤气灯下》(英语:Gaslight),是1944年上映的一部关于爱情、阴谋、悬疑的美国经典电影,由乔治·库克执导。瑞典国宝级影后英格丽·褒曼由此首夺奥斯卡最佳女主角奖。影片的情节紧
  • 亚灌木亚灌木(拉丁语:suffrutex)是一个园艺学名词,不是正式的植物分类学术语。多指比灌木矮,枝条匍匐的木本多年生植物,其越冬的木本生长一般不超过10-20厘米;以及仅有半木质化和寿命较短
  • 伍仁桥镇伍仁桥镇,是中国河北省安国市下辖的一个乡镇级行政单位。伍仁桥镇下辖以下地区:伍仁桥村、伍仁村、流昌村、南章令村、流托村、中送村、奉伯村、寺下村、军诜村、南郭村、新军