信源编码定理

✍ dations ◷ 2025-11-09 08:35:14 #信息论

在信息论中,香农的信源编码定理(或无噪声编码定理)确立了数据压缩的限度,以及香农熵的操作意义。

信源编码定理表明(在极限情况下,随着独立同分布随机变量数据流的长度趋于无穷)不可能把数据压缩得码率(每个符号的比特的平均数)比信源的香农熵还小,又不丢失信息。但是有可能使码率任意接近香农熵,且损失的概率极小。

码符号的信源编码定理把码字的最小可能期望长度看作输入字(看作随机变量)的熵和目标编码表的大小的一个函数,给出了此函数的上界和下界。

信源编码是从信息源的符号(串行)到码符号集(通常是bit)的映射,使得信源符号可以从二进制比特(无损信源编码)或有一些失真(有损信源编码)中准确恢复。这是在数据压缩的概念。

在信息论中,信源编码定理非正式地陈述为:

N 个熵均为 () 的独立同分布的随机变量在 → ∞ 时,可以很小的信息损失风险压缩成多于 () bit;但相反地,若压缩到少于 () bit,则信息几乎一定会丢失。

Σ1, Σ2 表示两个有限编码表,并令 Σ∗
1 和 Σ∗
2 (分别)表示来自那些编码表的所有有限字的集合。

X 为从 Σ1 取值的随机变量,令    为从 Σ∗
1 到 Σ∗
2 的唯一可译码,其中 2| = 。令 S 表示字长   () 给出的随机变量。

如果    是对 X 拥有最小期望字长的最佳码,那么(Shannon 1948):

对于 1 ≤ ≤ 令 表示每个可能的 的字长。定义 q i = a s i / C {\displaystyle q_{i}=a^{-s_{i}}/C} 1 + ... + = 1。于是

其中第二行由吉布斯不等式推出,而第五行由克拉夫特不等式推出:

因此 log ≤ 0.

对第二个不等式我们可以令

于是

因此

并且

因此由克拉夫特不等式,存在一种有这些字长的无前缀编码。因此最小的 S 满足

相关

  • 罗纳德·罗斯罗纳德·罗斯爵士,KCB(英语:Sir Ronald Ross,1857年5月13日-1932年9月16日),苏格兰医师。主要研究疟疾的侵入机制与治疗方法,且在西非发现传播疟疾的疟蚊。由于疟疾研究,而获得1902年
  • 二氟一氯甲烷二氟一氯甲烷,别名氟利昂-22、R-22,分子式CHClF2。无色近乎无臭气体。不可燃。微溶于水。由三氯甲烷和氟化氢在五氯化锑催化下反应而得。用作致冷剂、聚四氟乙烯树脂原料和灭
  • 艾丽斯·芒罗艾丽斯·安·芒罗(英语:Alice Ann Munro,1931年7月10日-),或译艾莉丝·孟洛、爱丽丝·蒙若、爱丽丝·门罗,原姓莱德劳(Laidlaw),加拿大女作家,被誉为“加拿大的契诃夫”,三次获得加拿大
  • 巴基斯坦人口巴基斯坦人口为220,892,340(2020年),旁遮普族占56%,普什图族占16%,信德族占13%,俾路支人占4%和来自印度的莫哈吉尔人。97%以上的居民信奉伊斯兰教,1.5%信奉印度教,1.3%信奉基督教,0.2
  • 台湾银行篮球队台湾银行篮球队是一支台湾的业余甲组或半职业男子篮球队。1973年台湾银行在台湾省政府主席谢东闵裁定下成立篮球队,于1974年投入甲组篮球联赛;并于2003成为超级篮球联赛创始球
  • 2013年马来西亚羽毛球黄金大奖赛2013年马来西亚羽毛球黄金大奖赛为第5届马来西亚羽毛球黄金大奖赛,是2013年世界羽联大奖赛的其中一站。本届赛事于2013年4月30日-5月4日在马来西亚吉隆坡举行,并获得YONEX-SUN
  • 2018年夏季青年奥林匹克运动会俄罗斯代表团2018年夏季青年奥林匹克运动会俄罗斯代表团是俄罗斯所派出的2018年夏季青年奥林匹克运动会代表团。在这次的赛事中,该国共派出93位运动员参加24个项目。在这次的赛事中,俄罗斯
  • 玩枪走火玩枪走火(英语:American Guns),是美国制作公司Gurney Productions为探索频道制播的真人实境节目,纪录由里察·怀赫兹所创立的Gunsmoke枪支公司之实际营运情况,Gunsmoke枪支公司位
  • 愤怒的伦理学《愤怒的伦理学》(韩语:분노의 윤리학,英语:),是一部2013年上映的韩国电影。为新锐导演朴明朗首次执导的剧情长片,以一名女研究生的死亡为中心,让五个各怀鬼胎的男女流露出自私冷酷
  • 梁美京梁美京(韩语:양미경,1961年7月25日-),韩国女演员。现任仁德大学(Induk Institute of Technology)放送演艺学系教授。2009年2月20日,她从花町内县道社会福祉大学社会福祉学系毕业,取得