率失真理论

✍ dations ◷ 2024-12-23 13:43:08 #信号处理

数据率失真理论(Rate distortion theory)或称信息率-失真理论(information rate-distortion theory)是信息论的主要分支,其的基本问题可以归结如下:对于一个给定的信源(source, input signal)分布与失真度量,在特定的码率下能达到的最小期望失真;或者为了满足一定的失真限制,可允许的最大码率为何,D 定义为失真的符号。

要完全避免失真几乎不可能。处理信号时必须允许有限度的失真﹐可减小所必需的信息率。1959年﹐Claude Shannon 首先发表《逼真度准则下的离散信源编码定理》一文,提出了率失真函数的概念。

失真函数能量化输入与输出的差异,以便进行数学分析。令输入信号为 χ {\displaystyle \chi } | ( | ), 有时被称为一个测试信道 (test channel), 系一种条件概率之概率密度函数 (PDF),其中信道输出 (compressed signal) 相对于来源 (original signal) , 以及 ( ; ) 是一种互信息(Mutual Information),在 与 之间被定义为

此处的 () 与 ( | ) 是指信宿(output signal) 的熵(entropy)以及基于信源(source signal)和信宿(output signal)相关的条件熵(conditional entropy), 分别为:

这一样来便可推导出率失真的公式, 相关表示如下:

这两个公式之间互为可逆推。

如果我们假设 () 服从正态分布且方差为σ2, 并且假设 是连续时间独立信号(或等同于来源无记忆或信号不相关),我们可以发现下列的率失真公式的“公式解”(analytical expression):

下图是本公式的几何面貌:

Rate distortion function.png

率失真理论告诉我们“没有压缩系统存在于灰色区块之外”。可以说越是接近红色边界,运行效率越好。一般而言,想要接近边界就必须透过增加码块(coding block)的长度参数。然而,块长度(blocklengths)的获取则来自率失真公式的量化(quantizers)有关。

这样的率失真理论(rate–distortion function)仅适用于高斯无记忆信源(Gaussian memoryless sources)。

伯努利信源 X {\displaystyle X} X B e r n o u l l i ( p ) {\displaystyle X\thicksim Bernoulli(p)} ,以汉明失真描述的率失真函数为:

R ( D ) = { H ( p ) H ( D ) , 0 D m i n { p , 1 p } 0 , D m i n { p , 1 p } {\displaystyle R(D)={\begin{cases}H(p)-H(D),&0\leq D\leq min\{p,1-p\}\\0,&D\geq min\{p,1-p\}\end{cases}}}

平行高斯信源的率失真函数为一经典的反注水算法(Reverse water-filling algorithm),我们可以找出一阈值 λ {\displaystyle \lambda } ,只有方差大于 λ {\displaystyle \lambda } 的信源才有必要配置比特来描述,其他信源则可直接发送与接收,不会超过最大可容许的失真范围。

我们可以使用平方误差失真函数,计算平行高斯信源的率失真函数。注意,此处信源不一定同分布:

X 1 , X 2 . . . , X m {\displaystyle X_{1},X_{2}...,X_{m}} X i N ( 0 , σ i 2 ) {\displaystyle X_{i}\thicksim N(0,\sigma _{i}^{2})} ,此时率失真函数为,

R ( D ) = i = 1 m 1 2 l o g σ i 2 D i {\displaystyle R(D)=\sum _{i=1}^{m}{1 \over 2}log{{\sigma _{i}^{2}} \over {D_{i}}}}

其中,

D i = { λ , if  λ < σ i 2 σ i 2 , if  λ σ i 2 {\displaystyle D_{i}={\begin{cases}\lambda ,&{\text{if }}{\lambda }<{\sigma _{i}^{2}}\\\sigma _{i}^{2},&{\text{if }}{\lambda }\geq {\sigma _{i}^{2}}\end{cases}}}

λ {\displaystyle \lambda } 必须满足限制:

i = 1 m D i = D {\displaystyle \sum _{i=1}^{m}D_{i}=D}

相关

  • 甲醇甲醇(英语:Methanol,或Methyl alcohol;分子式:CH3OH或MeOH)又称羟基甲烷、木醇(wood alcohol)与木精(wood spirits),是一种有机化合物,为最简单的醇类。甲醇有“木醇”与“木精”之名,源
  • miRNA小分子核糖核酸(英语:microRNA,缩写为miRNA)又译微核糖核酸,是真核生物中广泛存在的一种长约21到23个核苷酸的核糖核酸(RNA)分子,可调节其他基因的表达。miRNA来自一些从DNA转录而来
  • 约翰·乔治·哈尔斯克约翰·乔治·哈尔斯克 (德语:Johann Georg Halske, 1814年7月30日-1890年3月18日) 是一位德国工程师和企业家。1814年出生于汉堡,1844年在柏林创建自己的工作坊。1847年10月12
  • 埃瑞克·康特埃瑞克·康特(Eric Ivan Cantor;1963年6月6日-)是美国的一位政治人物、律师和商人。在2001年至2014年期间,他担任维吉尼亚州第7选区的众议院议员。他的党籍是共和党。在他就任国
  • 杉下茂杉下茂(1925年9月17日-)为日本的棒球选手,出生于东京府东京市神田区。他曾效力于日本职棒千叶罗德海洋等,守备位置为投手,1961年退休,生涯通算215胜。 50 大岛信雄 | 51 松田清 | 5
  • 千层塔蟹寓螺千层塔蟹寓螺(学名:)是翼舌类支序的蟹寓螺科物种,属于微小贝的一种。本物种分布的地域北起日本海到最南端的东中国海,包括中国大陆山东半岛青岛一带的黄渤海水域及台湾彰化县和美
  • F理论F理论(F-theory)为弦论衍生出的词汇,可视为M理论(Mother-theory)的伴侣,但意义则有所不同。大略来说,F理论是源自IIB型弦理论 ,并借由非微扰方式成立的。此外,IIB型弦论则是成效于轴
  • 摩尔·弗兰德斯摩尔·弗兰德斯是丹尼尔·笛福于1721年创作的小说,讲述奇女子摩尔的一生。摩尔自幼由吉普赛人收养,14时被一名好心的夫人收留,和夫人的女儿一起读书。同住期间,夫人的大儿子诱奸
  • Bitstream CharterBitstream Charter 是一个由马修·卡特于1987年为 Bitstream 设计的有衬线体字体,它的设计是基于皮埃尔·西蒙·福尼尔(英语:Pierre-Simon Fournier)于18世纪所创造的字体。被 B
  • 天野由梨天野 由梨(1966年1月5日-)是一名女性声优,本名吉川智子(よしかわ ともこ,Yosikawa Tomoko),京都府京都市伏见区出身。代表作有‘高智能方程式’系列(葵今日子)、‘无责任舰长’(由里子