K-L变换

✍ dations ◷ 2025-02-25 14:57:23 #K-L变换

K-L转换(Karhunen-Loève Transform)是建立在统计特性基础上的一种转换,它是均方差(MSE, Mean Square Error)意义下的最佳转换,因此在资料压缩技术中占有重要的地位。

K-L转换名称来自Kari Karhunen和Michel Loève。

K-L转换是对输入的向量x,做一个正交变换,使得输出的向量得以去除数据的相关性。

然而,K-L转换虽然具有均方差(MSE)意义下的最佳转换,但必须事先知道输入的讯号,并且需经过一些繁杂的数学运算,例如协方差(covariance)以及特征向量(eigenvector)的计算。因此在工程实践上K-L转换并没有被广泛的应用,不过K-L转换是理论上最佳的方法,所以在寻找一些不是最佳、但比较好实现的一些转换方法时,K-L转换能够提供这些转换性能的评价标准。

以处理图片为范例,在K-L转换途中,图片的能量会变得集中,有助于压缩图片,但是实际上,KL转算为input-dependent,即需要对每张输入图片存下一个转换机制,每张图都不一样,这在实务应用上是不实际的。

KL转换属于正交转换,其处输入讯号的原理如下:

对输入向量 x {displaystyle mathbf {x} } 做KL传换后,输出向量 X {displaystyle mathbf {X} } 之元素间( u 1 u 2 {displaystyle u_{1}neq u_{2}} , u 1 {displaystyle u_{1}} u 2 {displaystyle u_{2}} X {displaystyle mathbf {X} } 之元素的index)的相关性为零,即: E X ¯ ) ( X X ¯ ) ] = 0 {displaystyle E-{bar {X}})(X-{bar {X}})]=0}

展开上式并做消去:

E X ] X ¯ X ¯ = 0 {displaystyle EX]-{bar {X}}{bar {X}}=0}

如果 x ¯ = 0 {displaystyle {bar {x}}=0} ,因为KL转换式线性转换的关系, X ¯ = 0 {displaystyle {bar {X}}=0} ,则可以达成以下式,所以这里得输入向量 x {displaystyle mathbf {x} } 之平均值 x ¯ {displaystyle {bar {x}}} 需为 0 {displaystyle 0} ,所以KLT是专门用于随机程序的分析:

E X ] = 0 {displaystyle EX]=0}

其中 u 1 u 2 {displaystyle u_{1}neq u_{2}} ,即输出向量不同元素相关性为 0 {displaystyle 0}

回到矩阵表示形式,令 K {displaystyle mathbf {K} } 为KL转换矩阵,使:

X = K x {displaystyle mathbf {X} =mathbf {Kx} }

K {displaystyle mathbf {K} } x {displaystyle mathbf {x} } 表示 X {displaystyle mathbf {X} } 之covariance矩阵:

E = E = K E K T {displaystyle E=E=mathbf {K} Emathbf {K} ^{T}}

因为 x ¯ = 0 {displaystyle {bar {x}}=0} E {displaystyle E} 直接等于covariance矩阵:

E = K C K T {displaystyle E=mathbf {K} mathbf {C} mathbf {K} ^{T}}

其中 C {displaystyle mathbf {C} } x {displaystyle mathbf {x} } 之covariance矩阵。

如果要使 E X ] = 0 {displaystyle EX]=0} ,则 E {displaystyle E} 必须为对角线矩阵,即对角线上之值皆为 0 {displaystyle 0} ,所以 K {displaystyle mathbf {K} } 必须将传换成对角线矩阵,即 K {displaystyle mathbf {K} } 的每一行皆为 C {displaystyle mathbf {C} } 之特征向量。

K-L转换的目的是将原始数据做转换,使得转换后资料的相关性最小。若输入数据为一维:

y = n = 0 N 1 K x {displaystyle y=sum _{n=0}^{N-1}Kx}

K = e n {displaystyle K=e_{n}}

其中en为输入讯号x共变异数矩阵(covariance matrix)Cx的特征向量(eigenvector)

若输入讯号x为二维:

y = m = 0 M 1 n = 0 N 1 K K x {displaystyle y=sum _{m=0}^{M-1}sum _{n=0}^{N-1}KKx}

二维之K-L转换推导系自原先输入信号之自协方矩阵

C x i x j = E {displaystyle C_{x_{i}x_{j}}=E}

亦即

C x i x j = E E E E E E E E E E E E E a i n E E E E E ] {displaystyle C_{x_{i}x_{j}}={begin{bmatrix}E&E&E&dots &E&dots &E\E&E&E&dots &E&dots &E\vdots &vdots &vdots &ddots &vdots &ddots &vdots \E&E&E&dots &E&dots &a_{in}\vdots &vdots &vdots &ddots &vdots &ddots &vdots \E&E&E&dots &E&dots &Eend{bmatrix}}}

而得,此处假设输入信号x已经先减去平均值。

而当输入彼此具高度相关性,如影像等,则可假设其在水平与垂直方向上得以被分离,并以水平与垂直之相关系数 ρ H , ρ V {displaystyle rho _{H},rho _{V}} 加以表示

假设 x i {displaystyle x_{i}} x j {displaystyle x_{j}} 之水平和垂直距离分别为 h , v {displaystyle h,v}

E = ρ H h ρ V v {displaystyle E=rho _{H}^{h}cdot rho _{V}^{v}}

以一3x2之输入 X = {displaystyle X={begin{bmatrix}x1&x2&x3\x4&x5&x6end{bmatrix}}} 为例

此时 C x i x j = {displaystyle C_{x_{i}x_{j}}={begin{bmatrix}1&rho _{H}&rho _{H}^{2}&rho _{V}&rho _{H}rho _{V}&rho _{H}^{2}cdot rho _{V}\rho _{H}&1&rho _{H}&rho _{H}rho _{V}&rho _{V}&rho _{H}rho _{V}\rho _{H}^{2}rho _{V}&rho _{H}&1&rho _{H}^{2}rho _{V}&rho _{H}rho _{V}&rho _{V}\rho _{V}&rho _{H}rho _{V}&rho _{H}^{2}rho _{V}&1&rho _{H}&rho _{H}^{2}\rho _{H}rho _{V}&rho _{V}&rho _{H}rho _{V}&rho _{H}&1&rho _{H}\rho _{H}^{2}rho _{V}&rho _{H}rho _{V}&rho _{V}&rho _{H}^{2}&rho _{H}&1end{bmatrix}}}

而对于任意尺寸的水平或垂直方向之协方差矩阵可以表示成

C x x = {displaystyle C_{xx}={begin{bmatrix}rho &rho ^{2}&dots &rho ^{N-1}\rho ^{2}&rho &dots &rho ^{N-2}\vdots &vdots &ddots &vdots \rho ^{N-1}&rho ^{N-2}&dots &rho end{bmatrix}}}

可发现其值仅与 | i j | {displaystyle |i-j|} 有关,取其闭合形式,其基底元素 v i j {displaystyle v_{ij}}

v i j = 2 N + λ j sin ( ( 2 i N 1 ) ω 2 + j π 2 ) {displaystyle v_{ij}={sqrt {frac {2}{N+lambda _{j}}}}sin {({frac {(2i-N-1)omega }{2}}+{frac {jpi }{2}})}}

此处 λ j {displaystyle lambda _{j}} C x x {displaystyle C_{xx}} 之特征值

λ j = 1 ρ 2 1 2 ρ cos ω j + ρ 2 {displaystyle lambda _{j}={frac {1-rho ^{2}}{1-2rho ,cos {omega _{j}}+rho ^{2}}}}

其中 tan ( N ω j ) = ( 1 ρ 2 ) sin ω j cos ω j 2 ρ + ρ 2 cos ω j {displaystyle tan(Nomega _{j})=-{frac {(1-rho ^{2})sin {omega _{j}}}{cos {omega _{j}}-2rho +rho ^{2}cos {omega _{j}}}}}

对于不同的输入影像,其 ρ {displaystyle rho } 会有所不同,而若是令 ρ 1 {displaystyle rho rightarrow 1} ,则此转换不必与输入相关,同时继承了K-L转换去除相关性的优异性质。

此时 λ j = { N , if  j = 1 0 , if  j 1 {displaystyle lambda _{j}=left{{begin{matrix}N,&{mbox{if }}j=1\0,&{mbox{if }}jneq 1end{matrix}}right.}

代入上式,得 KLT| ρ 1 {displaystyle rho rightarrow 1} v i j = { 1 N cos ( 2 i 1 ) ( j 1 ) π 2 N , if  j = 1 2 N cos ( 2 i 1 ) ( j 1 ) π 2 N , if  j 1 {displaystyle v_{ij}=left{{begin{matrix}{sqrt {frac {1}{N}}}cos {frac {(2i-1)(j-1)pi }{2N}},&{mbox{if }}j=1\{sqrt {frac {2}{N}}}cos {frac {(2i-1)(j-1)pi }{2N}},&{mbox{if }}jneq 1end{matrix}}right.}

离散余弦转换较K-L转换在实务上较为有利,因其毋须纪录会随输入而改变的转换矩阵

相关

  • 两性异形两性异形(性别二态性)是指同一物种性两性之间的差别。最基本的两性异形是生殖构造(第一性征),但因为所有有性别的生物都有生殖构造的差异,一般来说两性异形主要用在指其他与生殖没
  • 戴元本戴元本(1928年7月31日-),生于江苏南京,籍贯湖南常德,中国理论物理和粒子物理学家。1947年考入中央大学理学院物理系,1952年毕业于南京大学后在南京工学院任教。1958年进入中国科学
  • 上加贝霍恩山上加贝霍恩山(德语:Ober Gabelhorn;4063米),是瑞士本宁阿尔卑斯山脉的一座山,位于采尔马特和吉纳尔(英语:Zinal)。上加贝霍恩山位于瓦莱州南端的吉纳尔谷(Val d'Anniviers(英语:Val d'An
  • 什么歌什么歌(英文:What A Song)是台湾乐团五月天的一支单曲,该歌曲是中国大陆2018年电影《捉妖记2》主题曲,由相信音乐于2018年1月30日早上8点数位发行。
  • 国手战 (台湾围棋)台湾围棋有两个比赛可以被称作国手战:
  • 莫斯科都市圈莫斯科都市圈是俄罗斯的都市圈,涵盖该国首都莫斯科、莫斯科州大部分地区及上述两地的周边地区。为欧洲最大的都市圈之一,2019年人口约为14,700,000。
  • 台中市公车1路台中市公车1路目前行驶自台中刑务所演武场到中台科技大学,运营业者为中台湾客运。单程行车里数约11.8公里,单程行车时间约45分。往台中刑务所演武场42站,往中台科技大学42站。
  • 瑙罗吉达达拜·瑙罗吉(印地语:दादा भाई नौरोजी,转写:dada bhai nauroji,英语:Dadabhai Naoroji;1825年9月4日-1917年6月30日),印度教育家、政治家、国大党奠基人之一。1825年出
  • 阿多夫 (瑞士)阿多夫,瑞士北部图尔高州弗拉恩菲尔德区的一个市镇。辖区总面积19.93 km2,总人口7,980 (2009.12)。阿多夫在历史文献上第一次提及是在886年,时称Ahadorf。1996年,阿多夫市镇扩大
  • 尼尔斯·阿克塞尔松尼尔斯·阿克塞尔松(瑞典语:Nils Axelsson,1906年1月18日-1989年1月18日),生于赫尔辛堡,瑞典男子足球运动员,司职后卫。他曾代表瑞典国家队参加1934年国际足联世界杯,结果队伍获得第八名。