率失真理论

✍ dations ◷ 2025-09-12 19:56:58 #信号处理

数据率失真理论(Rate distortion theory)或称信息率-失真理论(information rate-distortion theory)是信息论的主要分支,其的基本问题可以归结如下:对于一个给定的信源(source, input signal)分布与失真度量,在特定的码率下能达到的最小期望失真;或者为了满足一定的失真限制,可允许的最大码率为何,D 定义为失真的符号。

要完全避免失真几乎不可能。处理信号时必须允许有限度的失真﹐可减小所必需的信息率。1959年﹐Claude Shannon 首先发表《逼真度准则下的离散信源编码定理》一文,提出了率失真函数的概念。

失真函数能量化输入与输出的差异,以便进行数学分析。令输入信号为 χ {\displaystyle \chi } | ( | ), 有时被称为一个测试信道 (test channel), 系一种条件概率之概率密度函数 (PDF),其中信道输出 (compressed signal) 相对于来源 (original signal) , 以及 ( ; ) 是一种互信息(Mutual Information),在 与 之间被定义为

此处的 () 与 ( | ) 是指信宿(output signal) 的熵(entropy)以及基于信源(source signal)和信宿(output signal)相关的条件熵(conditional entropy), 分别为:

这一样来便可推导出率失真的公式, 相关表示如下:

这两个公式之间互为可逆推。

如果我们假设 () 服从正态分布且方差为σ2, 并且假设 是连续时间独立信号(或等同于来源无记忆或信号不相关),我们可以发现下列的率失真公式的“公式解”(analytical expression):

下图是本公式的几何面貌:

Rate distortion function.png

率失真理论告诉我们“没有压缩系统存在于灰色区块之外”。可以说越是接近红色边界,运行效率越好。一般而言,想要接近边界就必须透过增加码块(coding block)的长度参数。然而,块长度(blocklengths)的获取则来自率失真公式的量化(quantizers)有关。

这样的率失真理论(rate–distortion function)仅适用于高斯无记忆信源(Gaussian memoryless sources)。

伯努利信源 X {\displaystyle X} X B e r n o u l l i ( p ) {\displaystyle X\thicksim Bernoulli(p)} ,以汉明失真描述的率失真函数为:

R ( D ) = { H ( p ) H ( D ) , 0 D m i n { p , 1 p } 0 , D m i n { p , 1 p } {\displaystyle R(D)={\begin{cases}H(p)-H(D),&0\leq D\leq min\{p,1-p\}\\0,&D\geq min\{p,1-p\}\end{cases}}}

平行高斯信源的率失真函数为一经典的反注水算法(Reverse water-filling algorithm),我们可以找出一阈值 λ {\displaystyle \lambda } ,只有方差大于 λ {\displaystyle \lambda } 的信源才有必要配置比特来描述,其他信源则可直接发送与接收,不会超过最大可容许的失真范围。

我们可以使用平方误差失真函数,计算平行高斯信源的率失真函数。注意,此处信源不一定同分布:

X 1 , X 2 . . . , X m {\displaystyle X_{1},X_{2}...,X_{m}} X i N ( 0 , σ i 2 ) {\displaystyle X_{i}\thicksim N(0,\sigma _{i}^{2})} ,此时率失真函数为,

R ( D ) = i = 1 m 1 2 l o g σ i 2 D i {\displaystyle R(D)=\sum _{i=1}^{m}{1 \over 2}log{{\sigma _{i}^{2}} \over {D_{i}}}}

其中,

D i = { λ , if  λ < σ i 2 σ i 2 , if  λ σ i 2 {\displaystyle D_{i}={\begin{cases}\lambda ,&{\text{if }}{\lambda }<{\sigma _{i}^{2}}\\\sigma _{i}^{2},&{\text{if }}{\lambda }\geq {\sigma _{i}^{2}}\end{cases}}}

λ {\displaystyle \lambda } 必须满足限制:

i = 1 m D i = D {\displaystyle \sum _{i=1}^{m}D_{i}=D}

相关

  • 环境化学环境化学是研究化学物质在环境中迁移、转化、降解规律,研究化学物质在环境中的作用的学科。它不应与绿色化学,即探求如何减少潜在的污染源头的学科搞混乱。它可以定义为研究源
  • 靴子靴是一种鞋类,穿着于脚上并最少掩盖脚掌、足踝,可伸展至小腿甚至膝盖。靴可有各种不同的高度、颜色、物料及样式,大部分有明显的鞋跟。靴原是一种为工作而设的鞋类。设计作保护
  • 正宫昌德宫昌德宫(韩语:창덕궁)位于韩国首尔市钟路区,由朝鲜王朝(1392年–1897年)一众国王所建,是“朝鲜五大宫殿”之一。1997年被联合国教科文组织登入为世界文化遗产。 位处景福宫东面,作为
  • 巢鼬属小巢鼬(Galictis cuja) 大巢鼬(Galictis vittata)巢鼬属(学名 Galictis)属于鼬科动物,包括两种巢鼬,即小巢鼬和大巢鼬。两者都分布在中南美洲地区。巢鼬体长50厘米,体重1-3公斤。
  • 宽甸宽甸满族自治县是中国辽宁省丹东市下辖的一个自治县,在丹东市东部、鸭绿江北岸,邻接吉林省。面积6186平方千米,人口43万。邮政编码118200。自治县人民政府驻宽甸镇。下辖19个镇
  • 终止密码子在遗传密码中,终止密码子(英语:Stop codon),或称终止子,是信使RNA上的一个核苷酸三联体序列,代表翻译的终止。蛋白质是由特定氨酸生成的多肽序列折叠而成。翻译发生时,信使RNA中的大
  • 巴氏量表巴氏量表(Barthel Index),是一个由医疗团队来评估患者日常生活功能的评估量表。透过量表的鉴定,来了解患者需要给予什么医疗照顾及确认否符合申请外籍看护。 量表分数越低分,表示
  • 谢世儒谢世儒(英语:Chia Shi-Lu,1971年10月13日-),新加坡政治人物、医生,于2011年4月27日起成为新加坡国会议员。谢世儒在家中排名第一,另有一个弟弟。谢世儒毕业于英华中学和国家初级学院
  • 李彩华 (消歧义)李彩华可以指以下的名人:
  • 第一代阿博马尔公爵乔治·蒙克第一代阿博马尔公爵乔治·蒙克(英语:George Monck, 1st Duke of Albemarle 1608年12月6日-1670年1月3日)英国军人、政治家,英国内战时期曾在双方任职,曾组建冷溪卫队,他是促成1660