率失真理论

✍ dations ◷ 2025-02-23 10:31:29 #信号处理

数据率失真理论(Rate distortion theory)或称信息率-失真理论(information rate-distortion theory)是信息论的主要分支,其的基本问题可以归结如下:对于一个给定的信源(source, input signal)分布与失真度量,在特定的码率下能达到的最小期望失真;或者为了满足一定的失真限制,可允许的最大码率为何,D 定义为失真的符号。

要完全避免失真几乎不可能。处理信号时必须允许有限度的失真﹐可减小所必需的信息率。1959年﹐Claude Shannon 首先发表《逼真度准则下的离散信源编码定理》一文,提出了率失真函数的概念。

失真函数能量化输入与输出的差异,以便进行数学分析。令输入信号为 χ {\displaystyle \chi } | ( | ), 有时被称为一个测试信道 (test channel), 系一种条件概率之概率密度函数 (PDF),其中信道输出 (compressed signal) 相对于来源 (original signal) , 以及 ( ; ) 是一种互信息(Mutual Information),在 与 之间被定义为

此处的 () 与 ( | ) 是指信宿(output signal) 的熵(entropy)以及基于信源(source signal)和信宿(output signal)相关的条件熵(conditional entropy), 分别为:

这一样来便可推导出率失真的公式, 相关表示如下:

这两个公式之间互为可逆推。

如果我们假设 () 服从正态分布且方差为σ2, 并且假设 是连续时间独立信号(或等同于来源无记忆或信号不相关),我们可以发现下列的率失真公式的“公式解”(analytical expression):

下图是本公式的几何面貌:

Rate distortion function.png

率失真理论告诉我们“没有压缩系统存在于灰色区块之外”。可以说越是接近红色边界,运行效率越好。一般而言,想要接近边界就必须透过增加码块(coding block)的长度参数。然而,块长度(blocklengths)的获取则来自率失真公式的量化(quantizers)有关。

这样的率失真理论(rate–distortion function)仅适用于高斯无记忆信源(Gaussian memoryless sources)。

伯努利信源 X {\displaystyle X} X B e r n o u l l i ( p ) {\displaystyle X\thicksim Bernoulli(p)} ,以汉明失真描述的率失真函数为:

R ( D ) = { H ( p ) H ( D ) , 0 D m i n { p , 1 p } 0 , D m i n { p , 1 p } {\displaystyle R(D)={\begin{cases}H(p)-H(D),&0\leq D\leq min\{p,1-p\}\\0,&D\geq min\{p,1-p\}\end{cases}}}

平行高斯信源的率失真函数为一经典的反注水算法(Reverse water-filling algorithm),我们可以找出一阈值 λ {\displaystyle \lambda } ,只有方差大于 λ {\displaystyle \lambda } 的信源才有必要配置比特来描述,其他信源则可直接发送与接收,不会超过最大可容许的失真范围。

我们可以使用平方误差失真函数,计算平行高斯信源的率失真函数。注意,此处信源不一定同分布:

X 1 , X 2 . . . , X m {\displaystyle X_{1},X_{2}...,X_{m}} X i N ( 0 , σ i 2 ) {\displaystyle X_{i}\thicksim N(0,\sigma _{i}^{2})} ,此时率失真函数为,

R ( D ) = i = 1 m 1 2 l o g σ i 2 D i {\displaystyle R(D)=\sum _{i=1}^{m}{1 \over 2}log{{\sigma _{i}^{2}} \over {D_{i}}}}

其中,

D i = { λ , if  λ < σ i 2 σ i 2 , if  λ σ i 2 {\displaystyle D_{i}={\begin{cases}\lambda ,&{\text{if }}{\lambda }<{\sigma _{i}^{2}}\\\sigma _{i}^{2},&{\text{if }}{\lambda }\geq {\sigma _{i}^{2}}\end{cases}}}

λ {\displaystyle \lambda } 必须满足限制:

i = 1 m D i = D {\displaystyle \sum _{i=1}^{m}D_{i}=D}

相关

  • 修道院病毒科修道院病毒科是一种由粉介壳虫和蚜虫传播的植物病毒。修道院病毒包括甜菜枯黄病毒(英语:Beet yellows virus)、莴苣传染性枯黄病毒(英语:Lettuce infectious yellows virus)、葡萄
  • 六氢番茄红素六氢番茄红素是一种橙色色素,天然存在于西红柿和其他蔬菜。是类胡萝卜素在形成过程中的一个中间物质,具有很强的活性与抗氧化作用,是第二个类胡萝卜素生物合成的产物。分析表明
  • 槟威大桥槟威大桥(又称槟城大桥;马来语:Jambatan Pulau Pinang)是位于马来西亚槟城州的跨海大桥,为槟城州的著名地标。这长达13.5公里的大桥连接槟城州的槟岛和对岸的威省(请见图),属于高速
  • 长齿长舌蝠属长齿长舌蝠属(暗色长齿长舌蝠),哺乳纲、翼手目、叶口蝠科的一属,而与长齿长舌蝠属(暗色长齿长舌蝠)同科的动物尚有安德列斯长舌蝠属(小安德列斯长舌蝠)、蕉蝠属(蕉蝠)、索热尔长舌蝠属
  • 黑暗的胜利《黑暗的胜利》(英语:)是一部1939年的美国剧情电影,由艾德蒙·高汀(英语:Edmund Goulding)执导,主演是贝蒂·戴维斯,其他演员有乔治·布伦特(英语:George Brent)、亨弗莱·鲍嘉、杰拉丁
  • 贝勒多讷山脉坐标:45°03′N 5°48′E / 45.050°N 5.800°E / 45.050; 5.800贝勒多讷山脉(法语:Chaîne de Belledonne),是法国的山脉,位于该国东南部,属于多芬阿尔卑斯山脉的一部分,长60公里、
  • 拉斯克尔·卡塔尔久拉斯克尔·卡塔尔久(Lascăr Catargi) (罗马尼亚语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode"
  • 59式130毫米加农炮59式130毫米加农炮是中华人们共和国兵器工业部127厂生产的一款师属加农炮,该炮在仿制苏制M46加农炮基础上改进而来,主要用来杀伤敌方有生力量,摧毁敌方防御设施,也可以用来反坦
  • 杨真砂杨真砂(1944年-),台湾儿童文学作家暨教育家。曾任教于国民小学,并于课余从事儿童作文教学。作品有“半个苹果”、“作文教室”、“儿童名人故事”、“文字迷宫”等六十二本。退休
  • 詹姆斯·汉尼根詹姆斯·汉尼根(英语:James Hannigan,1971年7月23日-)是一位屡获殊荣的英国电影、电视和电子游戏作曲家,为《哈利波特游戏》、《魔戒游戏》、《终极动员令系列》、《银河飞将》、