信息冗余

✍ dations ◷ 2025-07-23 19:01:04 #信息论

在信息论中,信息冗余是传输消息所用数据位的数目与消息中所包含的实际信息的数据位的数目的差值。数据压缩是一种用来消除不需要的冗余的方法,校验和是在经过有限信道容量的噪声信道中通信,为了进行错误校正而增加冗余的方法。

在描述原始数据的冗余时,信源信息率为平均每个符号的熵。对于无记忆信源,这仅是每个符号的熵;而对于一个随机过程的最普遍形式为前 个符号的联合熵除以 之后,随着 趋于无穷时的极限

在信息论中经常提及一种语言的“熵率”或者“信息熵”。当信源是英文散文时这是正确的。由于无记忆信源的消息之间没有相互依赖性,所以无记忆信源的信息率为 H ( M ) {\displaystyle \mathrm {H} (M)} 的度量是互信息或者正规化变量。多个变量之间冗余的度量是全相关(total correlation)。

压缩数据的冗余是指 n {\displaystyle n} 个消息的期望压缩数据长度为 L ( M n ) {\displaystyle L(M^{n})\,\!} (或期望数据熵率 L ( M n ) / n {\displaystyle L(M^{n})/n\,\!} )与熵值 n r {\displaystyle nr\,\!} (或熵率 r {\displaystyle r\,\!} )的差。(这里我们假设数据是遍历的也是平稳的,例如无记忆信源。)虽然熵率之差 L ( M n ) / n r {\displaystyle L(M^{n})/n-r\,\!} 会随着 n {\displaystyle n\,\!} 增加而任意小,实际的差 L ( M n ) n r {\displaystyle L(M^{n})-nr\,\!} 已不能(尽管理论上可以)在有限熵的无记忆信源情况下上界为 1。

相关

  • 行距在字体排印学,行距(Leading)指代字体连续行的基线间的距离。这个词起源于手工排版的年代,铅字之间通过插入铅块来增加垂直距离。这个术语仍然被应用于如 QuarkXPress(英语:QuarkXP
  • 弗林特河弗林特河(Flint River)是位于美国乔治亚州的一条河流,全长344-英里-long(554-千米)。弗林特河在佛罗里达州阿巴拉契科拉和查特胡奇河汇合,形成了阿巴拉契科拉河。坐标:33°40′07″
  • 枫丹白露画派枫丹白露画派(法语:École de Fontainebleau)是法国文艺复兴后期的法国宫廷美术流派。16世纪,以法王两次修建巴黎东南郊的枫丹白露宫为契机,形成了两代枫丹白露派画家。
  • 提通期提通期(英语:Tithonian)是侏罗纪的第十一个时期,年代大约位于152.1–145百万年前。名称来自希腊神话人物提托诺斯(Tithonus)。
  • 满汉文化交流满汉文化指满族文化经过汉族文化冲突与融合之后所产生各具两族特色的清代文化,大部分情况下亦指清朝文化之实体,并且延续影响民国建立之后。三百多前,满族(女真)文化就开始了由原
  • 多胞形多胞形是一类由平的边界构成的几何结构。多胞形可以存在于任意维中。多边形为二维多胞形,多面体为三维多胞形,也可以延伸到三维以上的空间,如多胞体即为四维多胞形。当提到n度
  • 原稿原稿,又名手稿、底稿、草稿,是指文学或图像创作中作者完成的初始稿件,和修改稿、校对稿相对。在打字机和印刷术的发明前,作品原稿均为手写本,必须经人手抄写制作出复本,才能让更多
  • 2007年美国电影学会奖2007年美国电影学会奖(英语:American Film Institute Awards 2007)为表彰2007年年度最佳前10大电影与电视剧。
  • 2006年爪哇地震2006年爪哇地震可以指:
  • 阿德里安·范马纳恩阿德里安·范马纳恩(荷兰语:Adriaan van Maanen,1884年3月31日-1946年1月26日),荷兰-美国天文学家,也是范马南星的发现者。阿德里安·范·马纳恩出生在荷兰弗里斯兰省一个富裕的家