率失真理论

✍ dations ◷ 2025-04-26 12:14:37 #信号处理

数据率失真理论(Rate distortion theory)或称信息率-失真理论(information rate-distortion theory)是信息论的主要分支,其的基本问题可以归结如下:对于一个给定的信源(source, input signal)分布与失真度量,在特定的码率下能达到的最小期望失真;或者为了满足一定的失真限制,可允许的最大码率为何,D 定义为失真的符号。

要完全避免失真几乎不可能。处理信号时必须允许有限度的失真﹐可减小所必需的信息率。1959年﹐Claude Shannon 首先发表《逼真度准则下的离散信源编码定理》一文,提出了率失真函数的概念。

失真函数能量化输入与输出的差异,以便进行数学分析。令输入信号为 χ {\displaystyle \chi } | ( | ), 有时被称为一个测试信道 (test channel), 系一种条件概率之概率密度函数 (PDF),其中信道输出 (compressed signal) 相对于来源 (original signal) , 以及 ( ; ) 是一种互信息(Mutual Information),在 与 之间被定义为

此处的 () 与 ( | ) 是指信宿(output signal) 的熵(entropy)以及基于信源(source signal)和信宿(output signal)相关的条件熵(conditional entropy), 分别为:

这一样来便可推导出率失真的公式, 相关表示如下:

这两个公式之间互为可逆推。

如果我们假设 () 服从正态分布且方差为σ2, 并且假设 是连续时间独立信号(或等同于来源无记忆或信号不相关),我们可以发现下列的率失真公式的“公式解”(analytical expression):

下图是本公式的几何面貌:

Rate distortion function.png

率失真理论告诉我们“没有压缩系统存在于灰色区块之外”。可以说越是接近红色边界,运行效率越好。一般而言,想要接近边界就必须透过增加码块(coding block)的长度参数。然而,块长度(blocklengths)的获取则来自率失真公式的量化(quantizers)有关。

这样的率失真理论(rate–distortion function)仅适用于高斯无记忆信源(Gaussian memoryless sources)。

伯努利信源 X {\displaystyle X} X B e r n o u l l i ( p ) {\displaystyle X\thicksim Bernoulli(p)} ,以汉明失真描述的率失真函数为:

R ( D ) = { H ( p ) H ( D ) , 0 D m i n { p , 1 p } 0 , D m i n { p , 1 p } {\displaystyle R(D)={\begin{cases}H(p)-H(D),&0\leq D\leq min\{p,1-p\}\\0,&D\geq min\{p,1-p\}\end{cases}}}

平行高斯信源的率失真函数为一经典的反注水算法(Reverse water-filling algorithm),我们可以找出一阈值 λ {\displaystyle \lambda } ,只有方差大于 λ {\displaystyle \lambda } 的信源才有必要配置比特来描述,其他信源则可直接发送与接收,不会超过最大可容许的失真范围。

我们可以使用平方误差失真函数,计算平行高斯信源的率失真函数。注意,此处信源不一定同分布:

X 1 , X 2 . . . , X m {\displaystyle X_{1},X_{2}...,X_{m}} X i N ( 0 , σ i 2 ) {\displaystyle X_{i}\thicksim N(0,\sigma _{i}^{2})} ,此时率失真函数为,

R ( D ) = i = 1 m 1 2 l o g σ i 2 D i {\displaystyle R(D)=\sum _{i=1}^{m}{1 \over 2}log{{\sigma _{i}^{2}} \over {D_{i}}}}

其中,

D i = { λ , if  λ < σ i 2 σ i 2 , if  λ σ i 2 {\displaystyle D_{i}={\begin{cases}\lambda ,&{\text{if }}{\lambda }<{\sigma _{i}^{2}}\\\sigma _{i}^{2},&{\text{if }}{\lambda }\geq {\sigma _{i}^{2}}\end{cases}}}

λ {\displaystyle \lambda } 必须满足限制:

i = 1 m D i = D {\displaystyle \sum _{i=1}^{m}D_{i}=D}

相关

  • 平移对称性在仿射几何,平移(translation)是将物件的每点向同一方向移动相同距离。它是等距同构,是仿射空间中仿射变换的一种。它可以视为将同一个向量加到每点上,或将坐标系统的中心移动所
  • 鹅妈妈的故事《附道德训诫的古代故事》(法语:Histoires ou contes du temps passé, avec des moralités),副题《鹅妈妈的故事》(法语:Les Contes de ma mère l'Oye),是法国的夏尔·佩罗在1697
  • 钱塘江钱塘江是中国浙江省第一大河,发源于安徽省黄山,流经安徽、浙江二省,古名“浙江”,亦名“折江”或“之江”,最早见名于《山海经》,其流域是越国和吴越文化的主要发源地之一。河流全
  • Drama (专辑)《DRAMA》是台湾歌手炎亚纶2014迷你专辑1号作品,在2014年5月30日发行,收录炎亚纶领衔主演戏剧就是要你爱上我、爱上两个我最高询问度之挡不住的太阳、1/2、这不是我…等等六首
  • 蒙蒂塞洛蒙蒂塞洛(Monticello)位于美国弗吉尼亚州阿尔伯马尔县的夏洛茨维尔,曾经是美国第三任总统托马斯·杰斐逊的住所。蒙蒂塞洛于1987年入选联合国教科文组织世界遗产名录。27:梅萨维
  • 杰弗里·泰特杰弗里·菲利普·泰特爵士,CBE(英语:Sir Jeffrey Philip Tate,1943年4月28日-2017年6月2日),英国指挥家,患有先天性脊柱裂,历任英格兰室乐团(英语:English Chamber Orchestra)首任首席指
  • 高锰酸钙高锰酸钙五水合物,化学式为Ca(MnO4)2·5H2O。遇到冲击时,极可能产生爆炸。主要用于纺织工业及水的消毒。二次世界大战时,德军的Me 163彗星式火箭战斗机用的燃料之一,与高浓度过
  • 淳于嘉淳于嘉,济南郡(今山东省济南市)人,东汉时期的大臣。淳于嘉任光禄大夫。汉献帝初平元年(191年)七月,司空种拂和太尉赵谦免职,淳于嘉被任命为司空,太常马日䃅被任命为太尉。初平三年(192
  • 后过程主义考古学后过程主义考古学(英语:post-processual archaeology),简称后过程考古学,也称为解释考古学(interpretative archaeologies),是考古学理论中强调主观解释的考古学。尽管有一些模糊的
  • 红白胜利《红白胜利》(英语:Red Versus White)为王钧制作之大型综艺节目,之前于华视播出,而后于中视播出,主要是以游戏为主之一节目,开场及每段结束时口号为:“红白胜利,有够犀利!”1996年4月2