匹配追踪

✍ dations ◷ 2025-10-23 18:32:11 #算法

匹配追踪(matching pursuit, MP)最早是时频分析的分析工具,目的是要将一已知讯号拆解成由许多被称作为原子讯号的加权总和,而且企图找到与原来讯号最接近的解。其中原子讯号为一极大的原子库中的元素。以数学式子表示可以得到:

其中, a n {\displaystyle a_{n}} 是权重, g γ n {\displaystyle g_{\gamma _{n}}} 是由字典 D {\displaystyle D} 中获得的原子讯号。

如同傅立叶级数将一讯号拆解成一系列的正弦波的相加,其中每个成分拥有不同的系数作为权重,其数学式子如下:

而匹配追踪也具有将讯号拆解成一系列原子相加的意涵,甚至可以使用匹配追踪去描述傅立叶级数,也就是原子库对应到的所有正弦函数的集合。

为了找到最符合原讯号的一组原子加权总合,如果对原子库进行所有组合的尝试过于耗费时间。在1993年由Mallat S和Zhang Z的论文中,提出了一个贪婪算法(Greedy Algorithm),并大幅降低找出近似解的时间。其作法首先在原子库中寻找与原讯号内积结果最大的原子 g γ n {\displaystyle g_{\gamma _{n}}} ,找到此讯号以及其内积结果 a n {\displaystyle a_{n}} 之后再将原讯号减掉 a n g γ n {\displaystyle a_{n}g_{\gamma _{n}}} 作为下一次重复运算的原始讯号,如此反复做下去即可得到一系列的 a n {\displaystyle a_{n}} 以及原子 g γ n {\displaystyle g_{\gamma _{n}}} ,直到达到停止条件为止,其详细的算法如下:

在信号处理的许多应用中,需要将信号分解为一群在时域和频域都具有良好局部性(集中在某一范围)的函数,这些函数称为时频原子(time-frequency atom)。

选择不同的时频原子时,分解方式的特性会有很大的差异。窗函数傅立叶转换(window Fourier transform)和小波转换(wavelet transform)都是时频信号分解的方法。

通常一个时频原子群可以由单一的窗函数 g ( t ) L 2 ( R ) {\displaystyle g(t)\in L^{2}(R)} 经过scale、translation和modulation产生,令 g ( t ) O ( 1 t 2 + 1 ) {\displaystyle g(t)\in O({\frac {1}{t^{2}+1}})} 为一个实数的连续可微函数,且限制 g = 1 {\displaystyle \|g\|=1} g ( t ) {\displaystyle g(t)} 的积分不为零、 g ( 0 ) 0 {\displaystyle g(0)\neq 0}

γ = ( s , u , ξ ) {\displaystyle \gamma =(s,u,\xi )} 表示scale参数 s ( s > 0 ) {\displaystyle s(s>0)} 、translation参数 u {\displaystyle u} 和modulation参数 ξ {\displaystyle \xi } ,定义 g γ ( t ) {\displaystyle g_{\gamma }(t)}

g γ ( t ) = 1 s g ( t u s ) e i ξ t {\displaystyle g_{\gamma }(t)={\frac {1}{\sqrt {s}}}g({\frac {t-u}{s}})e^{i\xi t}}

其中 γ {\displaystyle \gamma } 是集合 Γ = R + × R 2 {\displaystyle \Gamma =R^{+}\times R^{2}} 中的元素, 1 s {\displaystyle {\frac {1}{\sqrt {s}}}} 使得 g = 1 {\displaystyle \|g\|=1}

事实上,函数群 D = ( g γ ( t ) ) γ Γ {\displaystyle D={(g_{\gamma }(t))}_{\gamma \in \Gamma }} 含有许多冗余的元素,对于任何函数 f ( t ) {\displaystyle f(t)} ,更有效率的表示方法是,在原子 ( g γ n ( t ) ) n N {\displaystyle {(g_{\gamma _{n}}(t))}_{n\in N}} 中,只选取适当数量的子集合,其中 γ n = ( s n , u n , ξ n ) {\displaystyle \gamma _{n}=(s_{n},u_{n},\xi _{n})} ,则 f ( t ) {\displaystyle f(t)} 可以表示为

f ( t ) = n = + a n g γ n ( t ) {\displaystyle f(t)=\sum _{n=-\infty }^{+\infty }a_{n}g_{\gamma _{n}}(t)}

在窗函数傅立叶转换中,所有原子 g γ n {\displaystyle g_{\gamma _{n}}} 具有相同的scale参数 s n = s 0 {\displaystyle s_{n}=s_{0}} ,因此主要分布在一个大小为 s 0 {\displaystyle s_{0}} 倍数的区间内,由于上述特性,窗函数傅立叶转换无法准确地描述比 s 0 {\displaystyle s_{0}} 大许多或小许多的函数结构。

小波转换将信号分解为不同尺度的时频原子,称为小波(wavelet),小波群 ( g γ n ( t ) ) n N {\displaystyle {(g_{\gamma _{n}}(t))}_{n\in N}} 的建构方法是令 ξ n = ξ 0 / s n {\displaystyle \xi _{n}=\xi _{0}/s_{n}} ,其中 ξ 0 {\displaystyle \xi _{0}} 是一个常数。小波转换可以分析不同尺寸的信号成分,然而,受限于参数 ξ n {\displaystyle \xi _{n}} s n {\displaystyle s_{n}} 必须成反比的条件,小波转换的系数无法精准估计傅立叶转换后具有良好局部性的频率成分。

自适应时频分解(adaptive time-frequency decomposition)的目的是将信号展开到一组波形(waveform)上,这些波形选自一个数量庞大的冗余字典,而匹配追踪是能达到自适应分解的一种方法。

一个希尔伯特空间可表示为 L 2 ( R ) {\displaystyle L^{2}(R)} ,其组成的复数函数 f {\displaystyle f} 必须满足

f = + | f ( t ) | 2 d t < + {\displaystyle \|f\|=\int _{-\infty }^{+\infty }{|f(t)|}^{2}dt<+\infty }

H {\displaystyle H} 代表一个希尔伯特空间,则将“字典”定义为 H {\displaystyle H} 中的一个向量群 D = ( g γ ) γ Γ {\displaystyle D={(g_{\gamma })}_{\gamma \in \Gamma }} ,满足 g γ = 1 {\displaystyle \|g_{\gamma }\|=1} ,其中 γ {\displaystyle \gamma } 是集合 Γ = R + × R 2 {\displaystyle \Gamma =R^{+}\times R^{2}} 中的元素。 V {\displaystyle V} 代表字典向量的封闭线性生成空间(closed linear span),在空间 V {\displaystyle V} 中,集合 D {\displaystyle D} 之向量的有限线性展开(finite linear expansion)是稠密(dense)的,如果 V = H {\displaystyle V=H} ,则称此字典具有完备性(completeness)。对于“时频原子分解”段落所描述的字典, H = L 2 ( R ) {\displaystyle H=L^{2}(R)} ,在空间 L 2 ( R ) {\displaystyle L^{2}(R)} 中,时频分子的有限线性展开是稠密的,因此该字典具有完备性。

假设有一信号 f H {\displaystyle f\in H} ,欲将其线性展开到由集合 D {\displaystyle D} 中选出的一组向量上,使得结果最匹配原来的信号结构。匹配追踪的方法是连续地将 f {\displaystyle f} 以其在集合 D {\displaystyle D} 中元素的正交投影(orthogonal projection)近似。

g γ 0 D {\displaystyle g_{\gamma _{0}}\in D} ,向量 f {\displaystyle f} 可以被分解为

f = f , g γ 0 g γ 0 + R f {\displaystyle f=\langle f,g_{\gamma _{0}}\rangle g_{\gamma _{0}}+Rf}

其中 R f {\displaystyle Rf} 是将 f {\displaystyle f} g γ 0 {\displaystyle g_{\gamma _{0}}} 的方向近似后的剩余向量(residual vector),由于 g γ 0 {\displaystyle g_{\gamma _{0}}} R f {\displaystyle Rf} 正交,可得下式

f 2 = | f , g γ 0 | 2 + R f 2 {\displaystyle {\|f\|}^{2}={|\langle f,g_{\gamma _{0}}\rangle |}^{2}+{\|Rf\|}^{2}}

为了最小化 R f {\displaystyle \|Rf\|} ,必须选取 g γ 0 D {\displaystyle g_{\gamma _{0}}\in D} 使得 | f , g γ 0 | {\displaystyle |\langle f,g_{\gamma _{0}}\rangle |} 最大化。在某些情况下,只能找到近似最佳的向量 g γ 0 {\displaystyle g_{\gamma _{0}}} ,符合

| f , g γ 0 | α   sup γ Γ | f , g γ | {\displaystyle |\langle f,g_{\gamma _{0}}\rangle |\geq \alpha \ {\underset {\g

相关

  • 艾德华·威尔森爱德华·奥斯本·威尔森(英语:Edward Osborne Wilson,1929年6月10日-),美国昆虫学家、博物学家和生物学家。他尤其以他对生态学、演化生物学和社会生物学的研究而著名。他的主题研
  • 罗马时代荷兰南部地区在古代被罗马人所占领,从公元前55年被凯萨所征服,到公元410年成为墨洛温王朝的一部分,一共历经四百余年,在罗马几年的统治之下,荷兰从此往后的生活以及文化层面深受
  • 林学钰林学钰(1937年3月6日-),中国水文地质和环境水文地质学家。出生于上海。籍贯福建福州。1957年毕业于长春地质学院水文地质及工程地质系。1997年当选为中国科学院院士。曾任华东师
  • 继父继亲是亲属的一种,是指生父与生母离异或父母其中一方逝世后,子女跟随其中一方。再婚配偶和孩子之间的关系,以及孩子和再婚配偶自身儿女之间的关系。其再婚配偶对于孩子就是继父
  • 气体遮护电弧焊接熔化极气体保护电弧焊(英语:gas metal arc welding),简称气体保护电弧焊、气体保护焊,可指熔化极惰性气体保护电弧焊和熔化极活性气体保护电弧焊。指用外加气体作为电弧介质并保
  • 胶质瘤脑瘤或颅内肿瘤(英语:Brain Cancer或Brain Tumour)是指脑内异常细胞的形成,定义为任何颅内肿瘤,发生的位置包括了脑本身各种细胞(神经元、胶质细胞、淋巴组织以及血管)、脑神经(许旺
  • 虚时间虚时间(imaginary time)是单位时间的虚数倍。这是一个从狭义相对论和量子力学领域派生的概念。其常被用于联系量子力学和统计力学。
  • 秘密立储制度秘密建储制,又称密建储贰、密匣立储、储位密建,为大清一种立储模式,由雍正帝所发明。皇帝将遗诏封入密匣内,一般放到北京乾清宫正殿正大光明匾额后;将来天子驾崩之时,由王侯宗室、
  • 陆丰话陆丰话是汉藏语系汉语族闽语支闽南语的一种方言,通行于广东省汕尾陆丰市及其附近一带,属闽南语的泉漳片或潮汕片。陆丰话是陆丰市使用人口最多的一种方言,当地人称之为福佬话(Ho
  • 素林府素林府(泰语:จังหวัดสุรินทร์,皇家转写:Changwat Surin,泰语发音:),又译素辇府,是泰国东北部之一个府。素林府本来是古代高棉族统治的要塞城池。原名为“巴泰沙曼城”