K-L变换

✍ dations ◷ 2025-05-17 14:37:02 #K-L变换

K-L转换(Karhunen-Loève Transform)是建立在统计特性基础上的一种转换,它是均方差(MSE, Mean Square Error)意义下的最佳转换,因此在资料压缩技术中占有重要的地位。

K-L转换名称来自Kari Karhunen和Michel Loève。

K-L转换是对输入的向量x,做一个正交变换,使得输出的向量得以去除数据的相关性。

然而,K-L转换虽然具有均方差(MSE)意义下的最佳转换,但必须事先知道输入的讯号,并且需经过一些繁杂的数学运算,例如协方差(covariance)以及特征向量(eigenvector)的计算。因此在工程实践上K-L转换并没有被广泛的应用,不过K-L转换是理论上最佳的方法,所以在寻找一些不是最佳、但比较好实现的一些转换方法时,K-L转换能够提供这些转换性能的评价标准。

以处理图片为范例,在K-L转换途中,图片的能量会变得集中,有助于压缩图片,但是实际上,KL转算为input-dependent,即需要对每张输入图片存下一个转换机制,每张图都不一样,这在实务应用上是不实际的。

KL转换属于正交转换,其处输入讯号的原理如下:

对输入向量 x {displaystyle mathbf {x} } 做KL传换后,输出向量 X {displaystyle mathbf {X} } 之元素间( u 1 u 2 {displaystyle u_{1}neq u_{2}} , u 1 {displaystyle u_{1}} u 2 {displaystyle u_{2}} X {displaystyle mathbf {X} } 之元素的index)的相关性为零,即: E X ¯ ) ( X X ¯ ) ] = 0 {displaystyle E-{bar {X}})(X-{bar {X}})]=0}

展开上式并做消去:

E X ] X ¯ X ¯ = 0 {displaystyle EX]-{bar {X}}{bar {X}}=0}

如果 x ¯ = 0 {displaystyle {bar {x}}=0} ,因为KL转换式线性转换的关系, X ¯ = 0 {displaystyle {bar {X}}=0} ,则可以达成以下式,所以这里得输入向量 x {displaystyle mathbf {x} } 之平均值 x ¯ {displaystyle {bar {x}}} 需为 0 {displaystyle 0} ,所以KLT是专门用于随机程序的分析:

E X ] = 0 {displaystyle EX]=0}

其中 u 1 u 2 {displaystyle u_{1}neq u_{2}} ,即输出向量不同元素相关性为 0 {displaystyle 0}

回到矩阵表示形式,令 K {displaystyle mathbf {K} } 为KL转换矩阵,使:

X = K x {displaystyle mathbf {X} =mathbf {Kx} }

K {displaystyle mathbf {K} } x {displaystyle mathbf {x} } 表示 X {displaystyle mathbf {X} } 之covariance矩阵:

E = E = K E K T {displaystyle E=E=mathbf {K} Emathbf {K} ^{T}}

因为 x ¯ = 0 {displaystyle {bar {x}}=0} E {displaystyle E} 直接等于covariance矩阵:

E = K C K T {displaystyle E=mathbf {K} mathbf {C} mathbf {K} ^{T}}

其中 C {displaystyle mathbf {C} } x {displaystyle mathbf {x} } 之covariance矩阵。

如果要使 E X ] = 0 {displaystyle EX]=0} ,则 E {displaystyle E} 必须为对角线矩阵,即对角线上之值皆为 0 {displaystyle 0} ,所以 K {displaystyle mathbf {K} } 必须将传换成对角线矩阵,即 K {displaystyle mathbf {K} } 的每一行皆为 C {displaystyle mathbf {C} } 之特征向量。

K-L转换的目的是将原始数据做转换,使得转换后资料的相关性最小。若输入数据为一维:

y = n = 0 N 1 K x {displaystyle y=sum _{n=0}^{N-1}Kx}

K = e n {displaystyle K=e_{n}}

其中en为输入讯号x共变异数矩阵(covariance matrix)Cx的特征向量(eigenvector)

若输入讯号x为二维:

y = m = 0 M 1 n = 0 N 1 K K x {displaystyle y=sum _{m=0}^{M-1}sum _{n=0}^{N-1}KKx}

二维之K-L转换推导系自原先输入信号之自协方矩阵

C x i x j = E {displaystyle C_{x_{i}x_{j}}=E}

亦即

C x i x j = E E E E E E E E E E E E E a i n E E E E E ] {displaystyle C_{x_{i}x_{j}}={begin{bmatrix}E&E&E&dots &E&dots &E\E&E&E&dots &E&dots &E\vdots &vdots &vdots &ddots &vdots &ddots &vdots \E&E&E&dots &E&dots &a_{in}\vdots &vdots &vdots &ddots &vdots &ddots &vdots \E&E&E&dots &E&dots &Eend{bmatrix}}}

而得,此处假设输入信号x已经先减去平均值。

而当输入彼此具高度相关性,如影像等,则可假设其在水平与垂直方向上得以被分离,并以水平与垂直之相关系数 ρ H , ρ V {displaystyle rho _{H},rho _{V}} 加以表示

假设 x i {displaystyle x_{i}} x j {displaystyle x_{j}} 之水平和垂直距离分别为 h , v {displaystyle h,v}

E = ρ H h ρ V v {displaystyle E=rho _{H}^{h}cdot rho _{V}^{v}}

以一3x2之输入 X = {displaystyle X={begin{bmatrix}x1&x2&x3\x4&x5&x6end{bmatrix}}} 为例

此时 C x i x j = {displaystyle C_{x_{i}x_{j}}={begin{bmatrix}1&rho _{H}&rho _{H}^{2}&rho _{V}&rho _{H}rho _{V}&rho _{H}^{2}cdot rho _{V}\rho _{H}&1&rho _{H}&rho _{H}rho _{V}&rho _{V}&rho _{H}rho _{V}\rho _{H}^{2}rho _{V}&rho _{H}&1&rho _{H}^{2}rho _{V}&rho _{H}rho _{V}&rho _{V}\rho _{V}&rho _{H}rho _{V}&rho _{H}^{2}rho _{V}&1&rho _{H}&rho _{H}^{2}\rho _{H}rho _{V}&rho _{V}&rho _{H}rho _{V}&rho _{H}&1&rho _{H}\rho _{H}^{2}rho _{V}&rho _{H}rho _{V}&rho _{V}&rho _{H}^{2}&rho _{H}&1end{bmatrix}}}

而对于任意尺寸的水平或垂直方向之协方差矩阵可以表示成

C x x = {displaystyle C_{xx}={begin{bmatrix}rho &rho ^{2}&dots &rho ^{N-1}\rho ^{2}&rho &dots &rho ^{N-2}\vdots &vdots &ddots &vdots \rho ^{N-1}&rho ^{N-2}&dots &rho end{bmatrix}}}

可发现其值仅与 | i j | {displaystyle |i-j|} 有关,取其闭合形式,其基底元素 v i j {displaystyle v_{ij}}

v i j = 2 N + λ j sin ( ( 2 i N 1 ) ω 2 + j π 2 ) {displaystyle v_{ij}={sqrt {frac {2}{N+lambda _{j}}}}sin {({frac {(2i-N-1)omega }{2}}+{frac {jpi }{2}})}}

此处 λ j {displaystyle lambda _{j}} C x x {displaystyle C_{xx}} 之特征值

λ j = 1 ρ 2 1 2 ρ cos ω j + ρ 2 {displaystyle lambda _{j}={frac {1-rho ^{2}}{1-2rho ,cos {omega _{j}}+rho ^{2}}}}

其中 tan ( N ω j ) = ( 1 ρ 2 ) sin ω j cos ω j 2 ρ + ρ 2 cos ω j {displaystyle tan(Nomega _{j})=-{frac {(1-rho ^{2})sin {omega _{j}}}{cos {omega _{j}}-2rho +rho ^{2}cos {omega _{j}}}}}

对于不同的输入影像,其 ρ {displaystyle rho } 会有所不同,而若是令 ρ 1 {displaystyle rho rightarrow 1} ,则此转换不必与输入相关,同时继承了K-L转换去除相关性的优异性质。

此时 λ j = { N , if  j = 1 0 , if  j 1 {displaystyle lambda _{j}=left{{begin{matrix}N,&{mbox{if }}j=1\0,&{mbox{if }}jneq 1end{matrix}}right.}

代入上式,得 KLT| ρ 1 {displaystyle rho rightarrow 1} v i j = { 1 N cos ( 2 i 1 ) ( j 1 ) π 2 N , if  j = 1 2 N cos ( 2 i 1 ) ( j 1 ) π 2 N , if  j 1 {displaystyle v_{ij}=left{{begin{matrix}{sqrt {frac {1}{N}}}cos {frac {(2i-1)(j-1)pi }{2N}},&{mbox{if }}j=1\{sqrt {frac {2}{N}}}cos {frac {(2i-1)(j-1)pi }{2N}},&{mbox{if }}jneq 1end{matrix}}right.}

离散余弦转换较K-L转换在实务上较为有利,因其毋须纪录会随输入而改变的转换矩阵

相关

  • 轻金属轻金属是原子质量较轻的金属。轻金属的一种定义是密度低于5 g/cm3的金属,也有其他的定义方式。不论使用哪一种分类法,锂、铍、钠、镁、铝几乎都列在轻金属中。一般来说轻金属
  • 科林·鲍威尔科林·卢瑟·鲍威尔(Colin Luther Powell,1937年4月5日-),第65任美国国务卿,美国历史上首位任职美国国务卿的非裔美国人。他在1990至1991年的海湾战争中担任参谋长联席会议主席,是
  • 副部级国务院直属事业单位是直属中华人民共和国国务院的事业单位。它不是国家行政机关,但中华人民共和国国务院授权其中一些单位行使一定的行政职能。《国务院关于国家行政机关和企
  • 2016年尼斯袭击事件2016年尼斯袭击,是2016年7月14日在法国尼斯的一场恐怖袭击事件。突尼斯裔法国人穆罕默德·拉豪杰·布哈勒蓄意驾驶一辆货车撞向在法国尼斯盎格鲁街庆祝国庆日的人群,随后又向
  • 维积利足球会维积利足球会(丹麦语:Vejle Boldklub Kolding)是位于丹麦南部城市瓦埃勒的一家足球俱乐部。维积利成立于1891年,在历史上曾经五次获得丹麦国内顶级足球联赛的冠军,六次获得丹麦
  • LQR控制器最优控制理论主要探讨的是让动力系统以在最小成本来运作,若系统动态可以用一组线性微分方程表示,而其成本为二次泛函,这类的问题称为线性二次(LQ)问题。此类问题的解即为线性二次
  • 江西人民出版社江西人民出版社是中华人民共和国的一家地方出版机构。该机构建立于1951年11月,位于江西省南昌市三经路47号附1号,隶属江西出版集团。江西人民出版社
  • 女体化女体化(日语:女体化、にょたいか),指男性在生理上变成女性的身体的一种虚构现象。这种现象在二次创作,特别是Yaoi作品中广为存在。很多同人志以原作漫画、动画中登场的男性角色,进
  • 斯科特·哈斯金斯科特·拉塞尔·哈斯金(英语:Scott Russell Haskin,1970年9月19日-),美国NBA联盟前职业篮球运动员。他在1993年的NBA选秀中第1轮第14顺位被印第安纳步行者选中。
  • 孔氏南宗孔氏南宗,是北宋末年以后在迁徙到中国浙江衢州的一支孔子后裔。靖康之难后,建炎二年(1128年)十一月,宋高宗赵构于扬州行宫举行继统后首次祀天大典,衍圣公孔端友与堂叔孔传奉诏陪位。孔端友返回曲阜后,因金兵大举入侵,遂恭负传家宝“孔子及亓官夫人楷木像”(据传为子贡亲手雕刻)、“唐吴道子绘孔子佩剑图”和“至圣文宣王庙祀朱印”等,与部分族人南迁,后家于浙江衢州。其子孙孔玠、孔搢、孔文远、孔万春、孔洙依次承袭衍圣公,史称南宗。元朝灭南宋后的至元十九年(1282年),元世祖议立孔子后,以寓衢者为大宗,欲召孔洙回曲阜袭