信源编码定理

✍ dations ◷ 2025-12-02 20:52:29 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 临床工程临床工程,又名临床工程学,是生物医学工程专业的一个分支,是一门关于临床医学和工程学的交叉学科。美国临床工程学会把临床工程师定义为在医疗卫生领域中应用工程和管理手段,来支
  • 波茨坦波茨坦(德语:Potsdam、波兰语:Poczdam、捷克语:Postupim)是德国勃兰登堡州的州府和无属县城市,其北部与柏林相邻(到柏林市中心约26公里)。波茨坦坐落于哈弗尔河边,是柏林/勃兰登堡都
  • 皮膜patagium (复数型: patagia)是一种皮膜,协助动物滑翔或飞行。皮膜可发现于现生与灭绝的动物身上,包含蝙蝠、擅攀鸟龙科恐龙、翼龙、飞蜥、飞蛙、飞蛇、鼯鼠。若皮膜延伸至动物
  • 新鳍亚纲全骨下纲 Holostei 真骨下纲 Teleostei新鳍亚纲是辐鳍鱼的一个类群,在演化上和早期的辐鳍鱼相比只有少些的差异。新鳍亚纲出现在二叠纪晚期(恐龙出现之前)的一些地方上。新鳍亚
  • 符号链接符号链接(软链接、Symbolic link)是一类特殊的文件, 其包含有一条以绝对路径或者相对路径的形式指向其它文件或者目录的引用。 符号链接最早在4.2BSD版本中出现(1983年)。今天POS
  • 前548年}}十二月,诸樊(春秋吴国第二十任君王)
  • 决不让步小说: 凯蕾拉·宾罕 劳拉·李迪《决不让步》(英语:),是一部2005年的美国电影作品,描述美国矿场女工集体诉讼,控告钢铁公司未处理与保护女性员工免于性骚扰的迫害的一部小说名,后改编
  • 井卷久一井卷久一((日文)いまき ひさかず,1942年12月5日-)曾任日本马自达汽车公司的第13任社长,亦曾获得2006年RJC年度风云人物奖,最大的嗜好是摄影。由于美国福特汽车曾是该公司最大的股东,
  • 觉罗伊图觉罗伊图(满语:ᡤᡳᡠᡵᠣᡳ ᡳᡨᡠ,穆麟德:,?-1677年),谥文僖,清朝政治人物、大学士。顺治元年,任内翰林秘书院学士。顺治二年,任明史副总裁。顺治四年,任云骑尉。后任二等阿达哈哈番。
  • 中国人民解放军海军出访列表中国海军出访列表,是中国人民解放军海军舰艇编队出国访问的行动列表,是向世界展示中国海军的窗口行为。