K-L 转换

✍ dations ◷ 2025-09-18 17:30:20 #估计理论,概率论,信号处理,随机过程

K-L转换(Karhunen-Loève Transform)是建立在统计特性基础上的一种转换,它是均方差(MSE, Mean Square Error)意义下的最佳转换,因此在资料压缩技术中占有重要的地位。

K-L转换名称来自Kari Karhunen和Michel Loève。

K-L转换是对输入的向量x,做一个正交变换,使得输出的向量得以去除数据的相关性。

然而,K-L转换虽然具有均方差(MSE)意义下的最佳转换,但必须事先知道输入的讯号,并且需经过一些繁杂的数学运算,例如协方差(covariance)以及特征向量(eigenvector)的计算。因此在工程实践上K-L转换并没有被广泛的应用,不过K-L转换是理论上最佳的方法,所以在寻找一些不是最佳、但比较好实现的一些转换方法时,K-L转换能够提供这些转换性能的评价标准。

以处理图片为范例,在K-L转换途中,图片的能量会变得集中,有助于压缩图片,但是实际上,KL转算为input-dependent,即需要对每张输入图片存下一个转换机制,每张图都不一样,这在实务应用上是不实际的。

KL转换属于正交转换,其处输入讯号的原理如下:

对输入向量 x {\displaystyle \mathbf {x} } 做KL传换后,输出向量 X {\displaystyle \mathbf {X} } 之元素间( u 1 u 2 {\displaystyle u_{1}\neq u_{2}} , u 1 {\displaystyle u_{1}} u 2 {\displaystyle u_{2}} X {\displaystyle \mathbf {X} } 之元素的index)的相关性为零,即: E X ¯ ) ( X X ¯ ) ] = 0 {\displaystyle E-{\bar {X}})(X-{\bar {X}})]=0}

展开上式并做消去:

E X ] X ¯ X ¯ = 0 {\displaystyle EX]-{\bar {X}}{\bar {X}}=0}

如果 x ¯ = 0 {\displaystyle {\bar {x}}=0} ,因为KL转换式线性转换的关系, X ¯ = 0 {\displaystyle {\bar {X}}=0} ,则可以达成以下式,所以这里得输入向量 x {\displaystyle \mathbf {x} } 之平均值 x ¯ {\displaystyle {\bar {x}}} 需为 0 {\displaystyle 0} ,所以KLT是专门用于随机程序的分析:

E X ] = 0 {\displaystyle EX]=0}

其中 u 1 u 2 {\displaystyle u_{1}\neq u_{2}} ,即输出向量不同元素相关性为 0 {\displaystyle 0}

回到矩阵表示形式,令 K {\displaystyle \mathbf {K} } 为KL转换矩阵,使:

X = K x {\displaystyle \mathbf {X} =\mathbf {Kx} }

K {\displaystyle \mathbf {K} } x {\displaystyle \mathbf {x} } 表示 X {\displaystyle \mathbf {X} } 之covariance矩阵:

E = E = K E K T {\displaystyle E=E=\mathbf {K} E\mathbf {K} ^{T}}

因为 x ¯ = 0 {\displaystyle {\bar {x}}=0} E {\displaystyle E} 直接等于covariance矩阵:

E = K C K T {\displaystyle E=\mathbf {K} \mathbf {C} \mathbf {K} ^{T}}

其中 C {\displaystyle \mathbf {C} } x {\displaystyle \mathbf {x} } 之covariance矩阵。

如果要使 E X ] = 0 {\displaystyle EX]=0} ,则 E {\displaystyle E} 必须为对角线矩阵,即对角线上之值皆为 0 {\displaystyle 0} ,所以 K {\displaystyle \mathbf {K} } 必须将传换成对角线矩阵,即 K {\displaystyle \mathbf {K} } 的每一行皆为 C {\displaystyle \mathbf {C} } 之特征向量。

K-L转换的目的是将原始数据做转换,使得转换后资料的相关性最小。若输入数据为一维:

y = n = 0 N 1 K x {\displaystyle y=\sum _{n=0}^{N-1}Kx}

K = e n {\displaystyle K=e_{n}}

其中en为输入讯号x共变异数矩阵(covariance matrix)Cx的特征向量(eigenvector)

若输入讯号x为二维:

y = m = 0 M 1 n = 0 N 1 K K x {\displaystyle y=\sum _{m=0}^{M-1}\sum _{n=0}^{N-1}KKx}

KLT和Principle component analysis (PCA)有相似的特性,二者之间有很细微的差异,其中KLT专门处理随机性的讯号,但PCA则没有这个限制。对PCA而言,这里假设输入讯号为ㄧ向量,输入向量 x {\displaystyle \mathbf {x} } 在乘上转换矩阵 W {\displaystyle \mathbf {W} } 之前,会先将输入向量扣去平均值,即:

X = W ( x x ¯ ) {\displaystyle \mathbf {X} =\mathbf {W} (\mathbf {x} -{\bar {x}})}

PCA会根据 x {\displaystyle \mathbf {x} } 之covariance矩阵来选择特征向量做为转换矩阵之内容:

E = W Λ W T {\displaystyle E=\mathbf {W\Lambda W} ^{T}}

其中 Λ {\displaystyle \mathbf {\Lambda } } 为对角线矩阵且对角线值为特征值。

由上述可见PCA和KLT之差异在于有没有减去平均值,这是由于输入资料分布的限制造成的,当输入向量支平均值为零时,二这者没有差异。

在影像的压缩上,目的是要将原始的影像档用较少的资料量来表示,由于大部分的影像并不是随机的分布,相邻的像素(Pixal)间存在一些相关性,如果我们能找到一种可逆转换(reversible transformation),它可以去除数据的相关性,如此一来就能更有效地储存资料,由于K-L转换是一种线性转换,并有去除资料相关性的特性,便可以将它应用在影像的压缩上。此外,由于K-L转换具有将讯号转到特征空间(eigenspace)的特性,因此也可以应用在人脸辨识上。

1. Ding, J. J. (2017). Advanced Digital Signal Processing http://djj.ee.ntu.edu.tw/ADSP8.pdf

2. Gerbrands, J.J., On the relationships between SVD, KLT, and PCA, Pattern Recogn., 14 (1981), pp. 375-381

相关

  • X综合征代谢综合征(metabolic syndrome)指生理代谢层面的心血管危险因子的聚集现象,这些危险因子主要包括高血压(或血压偏高但未达高血压诊断标准)、血脂异常(dyslipidemia)(包含血中三酸甘
  • 多溴联苯聚溴联苯(PBB)也称为多溴联苯,是联苯的多卤素衍生物的总称。其结构类似多氯联苯。聚溴联苯属于溴化阻燃剂,由于其阻燃特性,广泛用在电子器材的塑胶中。但因为其潜在的免疫毒性、
  • 观念概念是抽象的、普遍的想法,是充当指明实体、事件或关系的范畴或类的实体。在它们的外延中忽略事物的差异,如同它们是同一的去处理它们,所以概念是抽象的。它们等同的适用于在它
  • 呼吸道上皮细胞伪复层纤毛柱状上皮属于另一种单层柱状上皮的变异,细胞皆具有纤毛,又可以称为假复层纤毛柱状上皮。之所以称做伪复层是因为其在切片下看起来细胞好像多于一层所造成的错误观念
  • SSE公司SSE公司(SSE plc),旧称苏格兰和南方能源公司(Scottish and Southern Energy plc),是英国的一家能源公司,总部位于苏格兰珀斯。SSE公司在伦敦证券交易所上市,是FTSE100指数的成份股之
  • 军服军装或军服,是指军事或准军事部队的制服。二十世纪至今军装逐渐分化为作训服(野战服、迷彩服)、常服、礼服,而不同军队军种的服装颜色和样式亦有所不同,常服主要以:如陆军军服多半
  • 氦闪氦闪是低质量恒星(0.8~2.0太阳质量)在红巨星阶段非常短暂的热失控核聚变,大量的氦经由3氦过程成为碳 。预测太阳在演化成红巨星阶段时,将在离开主序带12亿年后经历氦闪。另一种更
  • 国家音乐厅 (爱尔兰)国家音乐厅(英语:National Concert Hall,NCH,爱尔兰语:An Ceoláras Náisiúnta)是位于爱尔兰共和国首都都柏林的一个音乐厅,靠近圣史蒂芬绿地,是爱尔兰最重要的古典音乐演出场地。
  • DOT语言DOT语言是一种文本图形描述语言。它提供了一种简单的描述图形的方法,并且可以为人类和计算机程序所理解。DOT语言文件通常是具有或是的文件扩展名。很多程序都可以处理DOT文
  • 托马斯·莫兰托马斯·莫兰(Thomas Moran,1837年2月12日-1926年8月25日)是一位美国哈德逊河派风景画家,以绘制落基山风景著称。他与哥哥爱德华·莫兰共用一间画室,后者也是当时的一位著名画家