率失真理论

✍ dations ◷ 2025-10-22 21:41:44 #信号处理

数据率失真理论(Rate distortion theory)或称信息率-失真理论(information rate-distortion theory)是信息论的主要分支,其的基本问题可以归结如下:对于一个给定的信源(source, input signal)分布与失真度量,在特定的码率下能达到的最小期望失真;或者为了满足一定的失真限制,可允许的最大码率为何,D 定义为失真的符号。

要完全避免失真几乎不可能。处理信号时必须允许有限度的失真﹐可减小所必需的信息率。1959年﹐Claude Shannon 首先发表《逼真度准则下的离散信源编码定理》一文,提出了率失真函数的概念。

失真函数能量化输入与输出的差异,以便进行数学分析。令输入信号为 χ {\displaystyle \chi } | ( | ), 有时被称为一个测试信道 (test channel), 系一种条件概率之概率密度函数 (PDF),其中信道输出 (compressed signal) 相对于来源 (original signal) , 以及 ( ; ) 是一种互信息(Mutual Information),在 与 之间被定义为

此处的 () 与 ( | ) 是指信宿(output signal) 的熵(entropy)以及基于信源(source signal)和信宿(output signal)相关的条件熵(conditional entropy), 分别为:

这一样来便可推导出率失真的公式, 相关表示如下:

这两个公式之间互为可逆推。

如果我们假设 () 服从正态分布且方差为σ2, 并且假设 是连续时间独立信号(或等同于来源无记忆或信号不相关),我们可以发现下列的率失真公式的“公式解”(analytical expression):

下图是本公式的几何面貌:

Rate distortion function.png

率失真理论告诉我们“没有压缩系统存在于灰色区块之外”。可以说越是接近红色边界,运行效率越好。一般而言,想要接近边界就必须透过增加码块(coding block)的长度参数。然而,块长度(blocklengths)的获取则来自率失真公式的量化(quantizers)有关。

这样的率失真理论(rate–distortion function)仅适用于高斯无记忆信源(Gaussian memoryless sources)。

伯努利信源 X {\displaystyle X} X B e r n o u l l i ( p ) {\displaystyle X\thicksim Bernoulli(p)} ,以汉明失真描述的率失真函数为:

R ( D ) = { H ( p ) H ( D ) , 0 D m i n { p , 1 p } 0 , D m i n { p , 1 p } {\displaystyle R(D)={\begin{cases}H(p)-H(D),&0\leq D\leq min\{p,1-p\}\\0,&D\geq min\{p,1-p\}\end{cases}}}

平行高斯信源的率失真函数为一经典的反注水算法(Reverse water-filling algorithm),我们可以找出一阈值 λ {\displaystyle \lambda } ,只有方差大于 λ {\displaystyle \lambda } 的信源才有必要配置比特来描述,其他信源则可直接发送与接收,不会超过最大可容许的失真范围。

我们可以使用平方误差失真函数,计算平行高斯信源的率失真函数。注意,此处信源不一定同分布:

X 1 , X 2 . . . , X m {\displaystyle X_{1},X_{2}...,X_{m}} X i N ( 0 , σ i 2 ) {\displaystyle X_{i}\thicksim N(0,\sigma _{i}^{2})} ,此时率失真函数为,

R ( D ) = i = 1 m 1 2 l o g σ i 2 D i {\displaystyle R(D)=\sum _{i=1}^{m}{1 \over 2}log{{\sigma _{i}^{2}} \over {D_{i}}}}

其中,

D i = { λ , if  λ < σ i 2 σ i 2 , if  λ σ i 2 {\displaystyle D_{i}={\begin{cases}\lambda ,&{\text{if }}{\lambda }<{\sigma _{i}^{2}}\\\sigma _{i}^{2},&{\text{if }}{\lambda }\geq {\sigma _{i}^{2}}\end{cases}}}

λ {\displaystyle \lambda } 必须满足限制:

i = 1 m D i = D {\displaystyle \sum _{i=1}^{m}D_{i}=D}

相关

  • 艾美亚目见内文Eimerlida艾美亚目(学名:Eimeriorina或Eimerlida),又名艾美耳亚目、艾美球虫亚目或球胞子虫亚目,是顶复门真球虫目之下的一个亚目。本亚目之下有12科、两个亚科及50多个属
  • 第7周期元素第7周期元素是元素周期表第七行(即周期)的元素,皆具有放射性,包括锕系元素。有:第1周期元素 -第2周期元素 -第3周期元素 -第4周期元素 -第5周期元素 -第6周期元素 -第7周期元素 -
  • 1994年劲歌金曲第四季季选得奖名单1994年劲歌金曲第四季季选是1994年十大劲歌金曲颁奖典礼第四个季选,季选歌曲会自动成为年尾举行的十大劲歌金曲颁奖典礼的候选金曲,在清水湾半岛电视城举行。本季选有48首候选
  • 甜蜜出关《甜蜜出关》(英语:The Sweet Escape)为美国歌手关·史蒂芬妮于2006年12月1日发行的第二张录音室专辑。《甜蜜开关》(英语:Wind It Up)为专辑首张单曲,获得美国告示牌百强单曲榜最
  • 膨胀阀膨胀阀可以指以下的物品。用来控制蒸汽膨胀的设备。热力学中的膨胀阀是在以下冷冻设备中,用来膨胀气体的设备。也可能是热膨胀阀(英语:Thermal expansion valve),是冷冻空调系统
  • 市道175号市道175号 关子岭-楠西,是位于台湾台南市的一条市道级公路。北起台南市白河区关子岭,南至台南市楠西区,全长共计31.130公里。该公路在东山区的部分,因为周边有许多咖啡简餐店,故有
  • 严长明严长明(1731年-1787年),字冬友,一作东友,又字道甫,号用晦。江宁人。自幼奇慧,礼部侍郎李绂对方苞说其“国器也”。乾隆十七年(1752年),前往秦淮水亭拜访吴敬梓。乾隆二十七年(1762年)帝南
  • 阚迪阚迪,黑龙江人,中国大陆主持人、导演。
  • 东宫傅东宫傅,是日本律令制时代负责太子教育的官吏,日常职责是辅导皇太子的道德教导。定员一名,官位相当于从四位上,主要由官员中的大纳言兼任。这职位是模仿唐代太子三师制度而设立。
  • 陈莉 (1955年)陈莉(1955年7月-),女,汉族,广东海口(今属海南)人,中华人民共和国政治人物,曾任海南省政协副主席,第十二届全国政协委员。