信息冗余

✍ dations ◷ 2025-07-01 15:08:17 #信息论

在信息论中,信息冗余是传输消息所用数据位的数目与消息中所包含的实际信息的数据位的数目的差值。数据压缩是一种用来消除不需要的冗余的方法,校验和是在经过有限信道容量的噪声信道中通信,为了进行错误校正而增加冗余的方法。

在描述原始数据的冗余时,信源信息率为平均每个符号的熵。对于无记忆信源,这仅是每个符号的熵;而对于一个随机过程的最普遍形式为前 个符号的联合熵除以 之后,随着 趋于无穷时的极限

在信息论中经常提及一种语言的“熵率”或者“信息熵”。当信源是英文散文时这是正确的。由于无记忆信源的消息之间没有相互依赖性,所以无记忆信源的信息率为 H ( M ) {\displaystyle \mathrm {H} (M)} 的度量是互信息或者正规化变量。多个变量之间冗余的度量是全相关(total correlation)。

压缩数据的冗余是指 n {\displaystyle n} 个消息的期望压缩数据长度为 L ( M n ) {\displaystyle L(M^{n})\,\!} (或期望数据熵率 L ( M n ) / n {\displaystyle L(M^{n})/n\,\!} )与熵值 n r {\displaystyle nr\,\!} (或熵率 r {\displaystyle r\,\!} )的差。(这里我们假设数据是遍历的也是平稳的,例如无记忆信源。)虽然熵率之差 L ( M n ) / n r {\displaystyle L(M^{n})/n-r\,\!} 会随着 n {\displaystyle n\,\!} 增加而任意小,实际的差 L ( M n ) n r {\displaystyle L(M^{n})-nr\,\!} 已不能(尽管理论上可以)在有限熵的无记忆信源情况下上界为 1。

相关

  • C01CA·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码C01(心脏病治疗药)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collab
  • 物权物权(拉丁语:ius in rem、jus in rem;right in rem、英语:real right、德语:Dingliches Recht)是指物权人直接支配特定的物并排他性地享受其利益的权利。《中华人民共和国物权法》
  • 孟买大都会区孟买大都会区是一个agglomeration(或城市化区域),由大都市孟买本身及其卫星城组成,包括5个市法团和15个较小的municipal councils。整个区域由Mumbai Metropolitan Development
  • 海地总理海地总理是海地共和国政府的首脑。总理是由总统任命,再经国民大会批准。总理负责执法,协助总统负责国防。无党籍   RDNP   拉瓦拉斯政治组织   MIDH   拉瓦拉斯之家
  • MH-53低空铺路者式直升机西科斯基HH-53“超级快乐绿巨人”(Super Jolly Green Giant)或MH-53J“低空铺路者”(Pave Low)是一种美国空军用的CH-53直升机发展版,专门加强战斗搜索与救援能力(CSAR)最初预计替
  • 管鱿目管鱿目(学名:Teuthida),又名枪形目或鱿目,俗名鱿鱼、乌贼,是软体动物门头足纲鞘亚纲十腕总目的动物,包括约300多个物种。管鱿目是十腕总目及所有头足纲动物中最繁荣昌盛的一支,从体
  • 标准太阳模型标准太阳模型(英语:Standard Solar Model,SSM)是借助于数学模型处理的球形气体太阳(在不同状态的电离,在内部深层的氢被完全电离成为等离子体)。这个模型从技术上说是球对称的一颗
  • 清除邻近的小天体清除邻近的小天体也可以以另外一种方法来说,也就是这颗星体是它的轨道里最大的那颗星体。这颗天体要有足够的质量才能把它轨道里的其他星体清除,这就好像在一片铺平的铁屑之中
  • 假尾孢菌属超过1.1千种,详见内文假尾孢菌属(学名:)是一种子囊菌门座囊菌纲煤炱目球腔菌科的无性型真菌属。本属的多个品种都是植物病原体,广泛存在,包括有超过1.1千个品种,主要于热带地区出现
  • 分立元器件门电路分立元器件门电路是由分立的半导体二极管、半导体三极管和MOS管以及电阻等元件组成的门电路。比如由两个半导体二极管组成的与门、或门电路,由一个三极管构成的非门电路都属