K-L转换(Karhunen-Loève Transform)是建立在统计特性基础上的一种转换,它是均方差(MSE, Mean Square Error)意义下的最佳转换,因此在资料压缩技术中占有重要的地位。
K-L转换名称来自Kari Karhunen和Michel Loève。
K-L转换是对输入的向量x,做一个正交变换,使得输出的向量得以去除数据的相关性。
然而,K-L转换虽然具有均方差(MSE)意义下的最佳转换,但必须事先知道输入的讯号,并且需经过一些繁杂的数学运算,例如协方差(covariance)以及特征向量(eigenvector)的计算。因此在工程实践上K-L转换并没有被广泛的应用,不过K-L转换是理论上最佳的方法,所以在寻找一些不是最佳、但比较好实现的一些转换方法时,K-L转换能够提供这些转换性能的评价标准。
以处理图片为范例,在K-L转换途中,图片的能量会变得集中,有助于压缩图片,但是实际上,KL转算为input-dependent,即需要对每张输入图片存下一个转换机制,每张图都不一样,这在实务应用上是不实际的。
KL转换属于正交转换,其处输入讯号的原理如下:
对输入向量
做KL传换后,输出向量
之元素间(
,
和
为
之元素的index)的相关性为零,即:![{displaystyle E-{bar {X}})(X-{bar {X}})]=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6fa3e39551afd861903189d10cbfef80dbd78395)
展开上式并做消去:
![{displaystyle EX]-{bar {X}}{bar {X}}=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/830842ca95706e3d58e9b08f5d24e15067a4c811)
如果
,因为KL转换式线性转换的关系,
,则可以达成以下式,所以这里得输入向量
之平均值
需为
,所以KLT是专门用于随机程序的分析:
![{displaystyle EX]=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0b9c1d7acdfd201e804662dbedfd2fa4d6f1c2e4)
其中
,即输出向量不同元素相关性为
。
回到矩阵表示形式,令
为KL转换矩阵,使:
data:image/s3,"s3://crabby-images/a5579/a557957c4e165d3df2a0382a899372378a368ce0" alt="{displaystyle mathbf {X} =mathbf {Kx} }"
以
和
表示
之covariance矩阵:
data:image/s3,"s3://crabby-images/555f7/555f7a30aa8e38db888707929aae350188f787c6" alt="{displaystyle E=E=mathbf {K} Emathbf {K} ^{T}}"
因为
,
直接等于covariance矩阵:
data:image/s3,"s3://crabby-images/f36d9/f36d9564926891ce18b91e316033673b19473573" alt="{displaystyle E=mathbf {K} mathbf {C} mathbf {K} ^{T}}"
其中
为
之covariance矩阵。
如果要使
,则
必须为对角线矩阵,即对角线上之值皆为
,所以
必须将传换成对角线矩阵,即
的每一行皆为
之特征向量。
K-L转换的目的是将原始数据做转换,使得转换后资料的相关性最小。若输入数据为一维:
data:image/s3,"s3://crabby-images/721ed/721ed7fe54360b0bcfb075136dd2c01e68920ce6" alt="y=sum _{{n=0}}^{{N-1}}Kx"
data:image/s3,"s3://crabby-images/fa125/fa12550eee7dd76381a7385c866b39f421a3425a" alt="K=e_{{n}}"
其中en为输入讯号x共变异数矩阵(covariance matrix)Cx的特征向量(eigenvector)
若输入讯号x为二维:
data:image/s3,"s3://crabby-images/dec51/dec51354900eeec28d997db056ea65363cbce976" alt="y=sum _{{m=0}}^{{M-1}}sum _{{n=0}}^{{N-1}}KKx"
二维之K-L转换推导系自原先输入信号之自协方矩阵
data:image/s3,"s3://crabby-images/57967/57967880b803c4109efa7a6eaf8d5babb6843d53" alt="{displaystyle C_{x_{i}x_{j}}=E}"
亦即
data:image/s3,"s3://crabby-images/26380/263801b174c846b7915c7d5a2c957a490061a59d" alt="{displaystyle C_{x_{i}x_{j}}={begin{bmatrix}E&E&E&dots &E&dots &E\E&E&E&dots &E&dots &E\vdots &vdots &vdots &ddots &vdots &ddots &vdots \E&E&E&dots &E&dots &a_{in}\vdots &vdots &vdots &ddots &vdots &ddots &vdots \E&E&E&dots &E&dots &Eend{bmatrix}}}"
而得,此处假设输入信号x已经先减去平均值。
而当输入彼此具高度相关性,如影像等,则可假设其在水平与垂直方向上得以被分离,并以水平与垂直之相关系数
加以表示
假设
与
之水平和垂直距离分别为data:image/s3,"s3://crabby-images/cd1e2/cd1e29371ef0b0c82d4d057c46c0c38f6bc5210a" alt="{displaystyle h,v}"
则 data:image/s3,"s3://crabby-images/23600/236006b73874cf33b8ded6b3e38e26724d4c9e00" alt="{displaystyle E=rho _{H}^{h}cdot rho _{V}^{v}}"
以一3x2之输入
为例
此时 data:image/s3,"s3://crabby-images/d45c3/d45c3c23ae79dfd4878d1572603fdc4c404b777c" alt="{displaystyle C_{x_{i}x_{j}}={begin{bmatrix}1&rho _{H}&rho _{H}^{2}&rho _{V}&rho _{H}rho _{V}&rho _{H}^{2}cdot rho _{V}\rho _{H}&1&rho _{H}&rho _{H}rho _{V}&rho _{V}&rho _{H}rho _{V}\rho _{H}^{2}rho _{V}&rho _{H}&1&rho _{H}^{2}rho _{V}&rho _{H}rho _{V}&rho _{V}\rho _{V}&rho _{H}rho _{V}&rho _{H}^{2}rho _{V}&1&rho _{H}&rho _{H}^{2}\rho _{H}rho _{V}&rho _{V}&rho _{H}rho _{V}&rho _{H}&1&rho _{H}\rho _{H}^{2}rho _{V}&rho _{H}rho _{V}&rho _{V}&rho _{H}^{2}&rho _{H}&1end{bmatrix}}}"
而对于任意尺寸的水平或垂直方向之协方差矩阵可以表示成
data:image/s3,"s3://crabby-images/c56b4/c56b48a1efbde22177f0a1f9ca6bdd06ca9d2071" alt="{displaystyle C_{xx}={begin{bmatrix}rho &rho ^{2}&dots &rho ^{N-1}\rho ^{2}&rho &dots &rho ^{N-2}\vdots &vdots &ddots &vdots \rho ^{N-1}&rho ^{N-2}&dots &rho end{bmatrix}}}"
可发现其值仅与
有关,取其闭合形式,其基底元素
为
data:image/s3,"s3://crabby-images/f7488/f7488f858336de2213bca1403d8fad4dc0354908" alt="{displaystyle v_{ij}={sqrt {frac {2}{N+lambda _{j}}}}sin {({frac {(2i-N-1)omega }{2}}+{frac {jpi }{2}})}}"
此处
为
之特征值
data:image/s3,"s3://crabby-images/b2e56/b2e56a853a4714123001b0e9fa9b8ab289b9c2e3" alt="{displaystyle lambda _{j}={frac {1-rho ^{2}}{1-2rho ,cos {omega _{j}}+rho ^{2}}}}"
其中 data:image/s3,"s3://crabby-images/5d603/5d6032662864b6776ac7683a5b351969a5fbce89" alt="{displaystyle tan(Nomega _{j})=-{frac {(1-rho ^{2})sin {omega _{j}}}{cos {omega _{j}}-2rho +rho ^{2}cos {omega _{j}}}}}"
对于不同的输入影像,其
会有所不同,而若是令
,则此转换不必与输入相关,同时继承了K-L转换去除相关性的优异性质。
此时 data:image/s3,"s3://crabby-images/13ec5/13ec55d355be9395fbe896c21a3ef63dcf7412ca" alt="{displaystyle lambda _{j}=left{{begin{matrix}N,&{mbox{if }}j=1\0,&{mbox{if }}jneq 1end{matrix}}right.}"
代入上式,得 KLT|
,data:image/s3,"s3://crabby-images/87a32/87a32d6b0a0479967b248520b1ffedd9e55f65c6" alt="{displaystyle v_{ij}=left{{begin{matrix}{sqrt {frac {1}{N}}}cos {frac {(2i-1)(j-1)pi }{2N}},&{mbox{if }}j=1\{sqrt {frac {2}{N}}}cos {frac {(2i-1)(j-1)pi }{2N}},&{mbox{if }}jneq 1end{matrix}}right.}"
离散余弦转换较K-L转换在实务上较为有利,因其毋须纪录会随输入而改变的转换矩阵