匹配追踪

✍ dations ◷ 2025-11-15 08:04:56 #算法

匹配追踪(matching pursuit, MP)最早是时频分析的分析工具,目的是要将一已知讯号拆解成由许多被称作为原子讯号的加权总和,而且企图找到与原来讯号最接近的解。其中原子讯号为一极大的原子库中的元素。以数学式子表示可以得到:

其中, a n {\displaystyle a_{n}} 是权重, g γ n {\displaystyle g_{\gamma _{n}}} 是由字典 D {\displaystyle D} 中获得的原子讯号。

如同傅立叶级数将一讯号拆解成一系列的正弦波的相加,其中每个成分拥有不同的系数作为权重,其数学式子如下:

而匹配追踪也具有将讯号拆解成一系列原子相加的意涵,甚至可以使用匹配追踪去描述傅立叶级数,也就是原子库对应到的所有正弦函数的集合。

为了找到最符合原讯号的一组原子加权总合,如果对原子库进行所有组合的尝试过于耗费时间。在1993年由Mallat S和Zhang Z的论文中,提出了一个贪婪算法(Greedy Algorithm),并大幅降低找出近似解的时间。其作法首先在原子库中寻找与原讯号内积结果最大的原子 g γ n {\displaystyle g_{\gamma _{n}}} ,找到此讯号以及其内积结果 a n {\displaystyle a_{n}} 之后再将原讯号减掉 a n g γ n {\displaystyle a_{n}g_{\gamma _{n}}} 作为下一次重复运算的原始讯号,如此反复做下去即可得到一系列的 a n {\displaystyle a_{n}} 以及原子 g γ n {\displaystyle g_{\gamma _{n}}} ,直到达到停止条件为止,其详细的算法如下:

在信号处理的许多应用中,需要将信号分解为一群在时域和频域都具有良好局部性(集中在某一范围)的函数,这些函数称为时频原子(time-frequency atom)。

选择不同的时频原子时,分解方式的特性会有很大的差异。窗函数傅立叶转换(window Fourier transform)和小波转换(wavelet transform)都是时频信号分解的方法。

通常一个时频原子群可以由单一的窗函数 g ( t ) L 2 ( R ) {\displaystyle g(t)\in L^{2}(R)} 经过scale、translation和modulation产生,令 g ( t ) O ( 1 t 2 + 1 ) {\displaystyle g(t)\in O({\frac {1}{t^{2}+1}})} 为一个实数的连续可微函数,且限制 g = 1 {\displaystyle \|g\|=1} g ( t ) {\displaystyle g(t)} 的积分不为零、 g ( 0 ) 0 {\displaystyle g(0)\neq 0}

γ = ( s , u , ξ ) {\displaystyle \gamma =(s,u,\xi )} 表示scale参数 s ( s > 0 ) {\displaystyle s(s>0)} 、translation参数 u {\displaystyle u} 和modulation参数 ξ {\displaystyle \xi } ,定义 g γ ( t ) {\displaystyle g_{\gamma }(t)}

g γ ( t ) = 1 s g ( t u s ) e i ξ t {\displaystyle g_{\gamma }(t)={\frac {1}{\sqrt {s}}}g({\frac {t-u}{s}})e^{i\xi t}}

其中 γ {\displaystyle \gamma } 是集合 Γ = R + × R 2 {\displaystyle \Gamma =R^{+}\times R^{2}} 中的元素, 1 s {\displaystyle {\frac {1}{\sqrt {s}}}} 使得 g = 1 {\displaystyle \|g\|=1}

事实上,函数群 D = ( g γ ( t ) ) γ Γ {\displaystyle D={(g_{\gamma }(t))}_{\gamma \in \Gamma }} 含有许多冗余的元素,对于任何函数 f ( t ) {\displaystyle f(t)} ,更有效率的表示方法是,在原子 ( g γ n ( t ) ) n N {\displaystyle {(g_{\gamma _{n}}(t))}_{n\in N}} 中,只选取适当数量的子集合,其中 γ n = ( s n , u n , ξ n ) {\displaystyle \gamma _{n}=(s_{n},u_{n},\xi _{n})} ,则 f ( t ) {\displaystyle f(t)} 可以表示为

f ( t ) = n = + a n g γ n ( t ) {\displaystyle f(t)=\sum _{n=-\infty }^{+\infty }a_{n}g_{\gamma _{n}}(t)}

在窗函数傅立叶转换中,所有原子 g γ n {\displaystyle g_{\gamma _{n}}} 具有相同的scale参数 s n = s 0 {\displaystyle s_{n}=s_{0}} ,因此主要分布在一个大小为 s 0 {\displaystyle s_{0}} 倍数的区间内,由于上述特性,窗函数傅立叶转换无法准确地描述比 s 0 {\displaystyle s_{0}} 大许多或小许多的函数结构。

小波转换将信号分解为不同尺度的时频原子,称为小波(wavelet),小波群 ( g γ n ( t ) ) n N {\displaystyle {(g_{\gamma _{n}}(t))}_{n\in N}} 的建构方法是令 ξ n = ξ 0 / s n {\displaystyle \xi _{n}=\xi _{0}/s_{n}} ,其中 ξ 0 {\displaystyle \xi _{0}} 是一个常数。小波转换可以分析不同尺寸的信号成分,然而,受限于参数 ξ n {\displaystyle \xi _{n}} s n {\displaystyle s_{n}} 必须成反比的条件,小波转换的系数无法精准估计傅立叶转换后具有良好局部性的频率成分。

自适应时频分解(adaptive time-frequency decomposition)的目的是将信号展开到一组波形(waveform)上,这些波形选自一个数量庞大的冗余字典,而匹配追踪是能达到自适应分解的一种方法。

一个希尔伯特空间可表示为 L 2 ( R ) {\displaystyle L^{2}(R)} ,其组成的复数函数 f {\displaystyle f} 必须满足

f = + | f ( t ) | 2 d t < + {\displaystyle \|f\|=\int _{-\infty }^{+\infty }{|f(t)|}^{2}dt<+\infty }

H {\displaystyle H} 代表一个希尔伯特空间,则将“字典”定义为 H {\displaystyle H} 中的一个向量群 D = ( g γ ) γ Γ {\displaystyle D={(g_{\gamma })}_{\gamma \in \Gamma }} ,满足 g γ = 1 {\displaystyle \|g_{\gamma }\|=1} ,其中 γ {\displaystyle \gamma } 是集合 Γ = R + × R 2 {\displaystyle \Gamma =R^{+}\times R^{2}} 中的元素。 V {\displaystyle V} 代表字典向量的封闭线性生成空间(closed linear span),在空间 V {\displaystyle V} 中,集合 D {\displaystyle D} 之向量的有限线性展开(finite linear expansion)是稠密(dense)的,如果 V = H {\displaystyle V=H} ,则称此字典具有完备性(completeness)。对于“时频原子分解”段落所描述的字典, H = L 2 ( R ) {\displaystyle H=L^{2}(R)} ,在空间 L 2 ( R ) {\displaystyle L^{2}(R)} 中,时频分子的有限线性展开是稠密的,因此该字典具有完备性。

假设有一信号 f H {\displaystyle f\in H} ,欲将其线性展开到由集合 D {\displaystyle D} 中选出的一组向量上,使得结果最匹配原来的信号结构。匹配追踪的方法是连续地将 f {\displaystyle f} 以其在集合 D {\displaystyle D} 中元素的正交投影(orthogonal projection)近似。

g γ 0 D {\displaystyle g_{\gamma _{0}}\in D} ,向量 f {\displaystyle f} 可以被分解为

f = f , g γ 0 g γ 0 + R f {\displaystyle f=\langle f,g_{\gamma _{0}}\rangle g_{\gamma _{0}}+Rf}

其中 R f {\displaystyle Rf} 是将 f {\displaystyle f} g γ 0 {\displaystyle g_{\gamma _{0}}} 的方向近似后的剩余向量(residual vector),由于 g γ 0 {\displaystyle g_{\gamma _{0}}} R f {\displaystyle Rf} 正交,可得下式

f 2 = | f , g γ 0 | 2 + R f 2 {\displaystyle {\|f\|}^{2}={|\langle f,g_{\gamma _{0}}\rangle |}^{2}+{\|Rf\|}^{2}}

为了最小化 R f {\displaystyle \|Rf\|} ,必须选取 g γ 0 D {\displaystyle g_{\gamma _{0}}\in D} 使得 | f , g γ 0 | {\displaystyle |\langle f,g_{\gamma _{0}}\rangle |} 最大化。在某些情况下,只能找到近似最佳的向量 g γ 0 {\displaystyle g_{\gamma _{0}}} ,符合

| f , g γ 0 | α   sup γ Γ | f , g γ | {\displaystyle |\langle f,g_{\gamma _{0}}\rangle |\geq \alpha \ {\underset {\g

相关

  • 强力强相互作用是作用于强子之间的力,是所知四种宇宙间基本作用力最强的,也是作用距离第二短的(大约在 10-15 m 范围内,比弱相互作用的范围大)。另外三种相互作用分别是引力、电磁力
  • 霉草科参见正文霉草科共包括8属约48种,广泛分布在全球热带和亚热带区域,包括东南亚、中南美洲、非洲、马达加斯加岛北部和澳大利亚东北,中国只有喜荫草属(Sciaphila)1属3种,分布在海南和
  • 巨脉蜻蜓巨脉蜻蜓(学名:Meganeura monyi),又名大尾蜻蜓或巨尾蜻蜓,是3亿年前石炭纪一种已灭绝的昆虫,外型与现今的蜻蜓接近。翼展范围自 65 cm(25.6英寸) 到超过 70 cm(28英寸),是目前已知地
  • 神经酰胺神经酰胺(英文:Ceramide)是一个蜡质脂质分子家族。神经酰胺分子是由一个鞘氨醇分子和一个脂肪酸分子构成的。神经酰胺在真核细胞的细胞膜中有较高的浓度,因为其是磷脂双分子层的
  • t̠ʃ清颚龈塞擦音或清拱龈后塞擦音(voiceless palato-alveolar affricate 或 voiceless domed postalveolar affricate)是一个清塞擦音,也称舌叶清塞擦音。属于比较常见的辅音。 英
  • 1473年重要事件及趋势重要人物
  • 拉尔萨幼发拉底河 · 底格里斯河乌鲁克 · 乌尔 · 埃利都 启什 · 拉格什 · 尼普尔 阿卡德帝国 · 库提 乌尔第三王朝 · 伊辛第一王朝 · 拉尔萨 · 伊辛第二王朝古巴比
  • 2008年的政治危机2008年-2009年泰国政治危机肇始于2008年8月26日清晨爆发的大规模反政府示威;泰国总理沙马·顺达卫9月2日早上宣布紧急状态令。此事件导致最终由人民民主联盟支持的民主党联合
  • 可支配收入可支配所得是经济名词,英文为“Disposable Income”,简称“DI”,其概念为“实际收到的所得”(net pay)。实务上是由总所得扣除直接税而得。与"Disposable Income"类似易混淆的概
  • 后弓兽后弓兽(学名),又名滑距兽,是一种长颈的南美洲的有蹄动物,属于滑距骨目。它有长的四肢,每肢上有三趾。最古老的化石可追溯至约7百万年前,而在约1万年前的更新世晚期便失去了化石纪录