信息冗余

✍ dations ◷ 2025-04-04 11:23:46 #信息论

在信息论中,信息冗余是传输消息所用数据位的数目与消息中所包含的实际信息的数据位的数目的差值。数据压缩是一种用来消除不需要的冗余的方法,校验和是在经过有限信道容量的噪声信道中通信,为了进行错误校正而增加冗余的方法。

在描述原始数据的冗余时,信源信息率为平均每个符号的熵。对于无记忆信源,这仅是每个符号的熵;而对于一个随机过程的最普遍形式为前 个符号的联合熵除以 之后,随着 趋于无穷时的极限

在信息论中经常提及一种语言的“熵率”或者“信息熵”。当信源是英文散文时这是正确的。由于无记忆信源的消息之间没有相互依赖性,所以无记忆信源的信息率为 H ( M ) {\displaystyle \mathrm {H} (M)} 的度量是互信息或者正规化变量。多个变量之间冗余的度量是全相关(total correlation)。

压缩数据的冗余是指 n {\displaystyle n} 个消息的期望压缩数据长度为 L ( M n ) {\displaystyle L(M^{n})\,\!} (或期望数据熵率 L ( M n ) / n {\displaystyle L(M^{n})/n\,\!} )与熵值 n r {\displaystyle nr\,\!} (或熵率 r {\displaystyle r\,\!} )的差。(这里我们假设数据是遍历的也是平稳的,例如无记忆信源。)虽然熵率之差 L ( M n ) / n r {\displaystyle L(M^{n})/n-r\,\!} 会随着 n {\displaystyle n\,\!} 增加而任意小,实际的差 L ( M n ) n r {\displaystyle L(M^{n})-nr\,\!} 已不能(尽管理论上可以)在有限熵的无记忆信源情况下上界为 1。

相关

  • 阿以冲突进行中巴勒斯坦人:约旦(1948–1994) 埃及(1948–1978) 伊拉克(1948–) 叙利亚(1948–) 黎巴嫩(1948–)苏伊士危机:(1956)南黎巴嫩冲突(英语:South Lebanon conflict (1985–2000)):消耗战
  • 厶部,就汉字索引来说,是为部首之一,康熙字典214个部首中的第二十八个(两划的则为第二十二个)。就繁体和简体中文中,厶部归于两划部首。厶部通常是从上或下方为部字,且无其他部首可
  • 布朗尼斯劳·马凌诺斯基布罗尼斯拉夫·卡斯珀·马林诺夫斯基(波兰语:Bronislaw Kasper Malinowski;1884年4月7日-1942年5月16日)是位发迹于英国的波兰人类学家,其建构以客观民族志记载田野调查研究成果的
  • 布尔根兰州布尔根兰州(德语:Burgenland,德语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gent
  • 项名达项名达(1789年-1850年),字步莱,号梅侣,浙江仁和县(今杭州余杭区仁和镇)人,清朝数学家。出生于乾隆五十四年(1789年)。卒于道光三十年(1850年)。嘉庆二十一年举人,国子监学正。道光六年,考进
  • 陆宗楷陆宗楷(?-?),榜姓陈,字健先,号凫川,浙江海寕人,为清朝政治人物。雍正元年(1723年)癸卯恩科第一名举人(解元),同年联捷三甲进士。官景山教习,雍正三年(1725年)授职检讨。历官礼部尚书,左迁内阁学
  • 韦斯咸西汉姆足球俱乐部(英语:West Ham United Football Club),英格兰传统足球俱乐部,位于东伦敦纽汉区,成立于1895年,初时名为“泰晤士铁厂”(Thames Ironworks FC),于1900年才更改今名。球
  • 维龙加山脉维龙加山脉(Virunga Mountains)是东非的火山群,位于爱德华湖和基伏湖之间的卢旺达、刚果民主共和国和乌干达接壤边境,由8座主要火山组成,是东非大裂谷的一部分,也是列于IUCN红色名
  • 潘帕斯猫潘帕斯猫(Leopardus pajeros)是一种小型猫科动物,分布于阿根廷,智利,玻利维亚,秘鲁,厄瓜多尔,并可能远至哥伦比亚西南部。虽然以“潘帕斯”命名,但这种猫科动物在草地,灌丛及海拔5,000
  • 麻阳苗族自治县麻阳苗族自治县(Mayang Miao Autonomous County)位于湖南省西部,怀化市西北部,地处辰水(锦江河)流域。地理坐标为东经109°24′-110°06′、北纬27°32′-28°01′。东临辰溪县,南