高斯金字塔

✍ dations ◷ 2025-04-28 20:30:19 #高斯金字塔

高斯金字塔(英文:Gaussian Pyramid)为在图像处理、计算机视觉、信号处理上所使用的一项技术。高斯金字塔本质上为信号的多尺度表示法,亦即将同一信号或图片多次的进行高斯模糊,并且向下取样,藉以产生不同尺度下的多组信号或图片以进行后续的处理,例如在影像辨识上,可以借由比对不同尺度下的图片,以防止要寻找的内容可能在图片上有不同的大小。高斯金字塔的理论基础为尺度空间理论,而后续也衍生出了多分辨率分析。

高斯金字塔背后的理论基础为尺度空间理论。这个的概念可以用在任意维度的信号中,不过最常用的地方还是在二维的影像信号上,以下将以二维影像信号作为主要讨论对象。给定一张图片 f ( x , y ) {displaystyle f(x,y)} L ( x , y ; t ) {displaystyle L(x,y;t)} 定义为:影像信号 f ( x , y ) {displaystyle f(x,y)} 和高斯函数 g ( x , y ; t ) = 1 2 π t e ( x 2 + y 2 ) / 2 t {displaystyle g(x,y;t)={frac {1}{2{pi }t}}e^{-(x^{2}+y^{2})/2t},} 的旋积。完整的式子为:

式中的分号代表旋积的对象为 x , y {displaystyle x,y} ,而分号右边的 t {displaystyle t} 表示定义的尺度大小。这个定义当 t 0 {displaystyle tgeq 0} 时对于所有的 t {displaystyle t} 都会成立,不过通常在实作上只会选取特定的 t {displaystyle t} 值。其中 t {displaystyle t} 为高斯函数的变异数。当 t {displaystyle t} 趋近于零的时候, g {displaystyle g} 成为一个单位脉冲响应,使得 L ( x , y ; t )   = f ( x , y ) {displaystyle L(x,y;t) =f(x,y)} ,这代表当 t = 0 {displaystyle t=0} 的时候我们可以把这项操作视为图片 f {displaystyle f} 本身。当 t {displaystyle t} 增加时, L {displaystyle L} 代表将影像 f {displaystyle f} 通过一个较大的高斯滤波器,从而使得影像的细节被去除更多。

根据尺度空间理论,假如限定从较精密的尺度推展到较粗糙的尺度的过程中,不能有新的结构被创造出来,那么高斯函数已经被证明出来为一个能够张成尺度空间的正则(Canonical)函数。

尺度空间的另外一种表现形式是将其视为一个扩散方程(举热传导方程式作为例子):

并且初始条件为 L ( x , y ; 0 ) = f ( x , y ) {displaystyle L(x,y;0)=f(x,y)} 。这个表示方式将图片上的内容视为温度的分布,并且将建立尺度空间表示形式的过程视为热传导随着时间 t {displaystyle t} 的扩散过程。另外,对于这种表现形式的仔细分析也统合了连续和离散尺度空间的理论,并且可以拓展到非线性的尺度空间。因此,我们可以说这种表示形式为尺度空间的基本。而高斯函数为此扩散方程的格林函数,也因此,在描述尺度空间表示方式和建立高斯金字塔时,会以高斯函数为主体。

在建立高斯金字塔的时候,我们首先会将影像转换为尺度空间的表示方式,亦即乘上不同大小的高斯函数,之后再依据取定的尺度向下取样。乘上的高斯函数大小和向下取样的频率通常会选为2的幂次,也就是说,在每次迭代的过程中,影像都会被乘上一个固定大小的高斯函数,并且被以长宽各0.5的比率被向下取样。如果将向下取样过程的图片一张一张叠在一起,会呈现一个金字塔的样子,因此这个过程称为高斯金字塔。

高斯金字塔的概念可以拿来进行边缘检测。高斯拉普拉斯算子(英文:Laplacian of Gaussian)为高斯金字塔的一个延伸,它可以作为加强影像边缘的一个带通滤波器。高斯拉普拉斯算子为影像通过高斯滤波器之后再通过拉普拉斯算子的结果:

然而,高斯拉普拉斯的结果会受到高斯函数的大小影响,为了去除这个影响,可以导入尺度归一化高斯拉普拉斯运算子

接着可以借由寻找 2 L {displaystyle nabla ^{2}L} 同时符合几何空间中和尺度空间中的局部极大值点,来寻找影像中的特征点。换句话说,对于输入影像 f ( x , y ) {displaystyle f(x,y)} ,我们可以借由建立起高斯金字塔,建出它在二维几何平面加上一维尺度空间共三维的空间,并且找出其亮度大于邻近26点的点作为特征点。

为了简化计算,我们可以将上述的热扩散函数带入高斯拉普拉斯算子,并进行近似以得到高斯差算子:

高斯差可以简单的透过将在尺度空间相邻的图片进行相减得到。这个方法被用在著名的尺度不变特征转换中:尺度不变特征转换借由寻找并描述不同尺度下的影像特征点,以进行不同影像之间的特征点比对。

相关

  • 美利坚联盟国美利坚联盟国(英语:the Confederate States of America,CSA),或称美利坚诸州同盟、美利坚邦联或迪克西(通俗说法),是自1861年至1865年由11个美国南方蓄奴州宣布从美利坚合众国分裂而
  • 阿方斯·比拉姆·德康多尔阿方斯·比拉姆·德康多尔(Alphonse Pyramus de Candolle,1806年10月28日-1893年4月4日)为法国-瑞士植物学家。
  • 台湾八景台湾八景,指的是台湾的八大景色,随着时代而有所变迁。在清代,1696年(清康熙35年)的《台湾府志》中,就有台湾八景的描述。那时选出来的八景分别是:由于当时台湾已开发的地方不多,因此
  • 桑德伯格桑德伯格(英语:Sandberg)是位于美国加利福尼亚州洛杉矶县的一个非建制地区。该地的面积和人口皆未知。桑德伯格的座标为34°44′19″N 118°42′20″W / 34.73861°N 118.70556
  • 戏偶戏偶(英语:puppet),有时也称傀儡,是人形的玩偶,由傀儡师(英语:puppeteer)在舞台背后或上空进行操作。傀儡师可用手、胳膊,或者绳、棍等控制设备来移动身体、头部、四肢甚至人偶的眼睛
  • 不存在的女儿《不存在的女儿》(英语:)是一本由美国作家金·爱德华兹所写的小说,是纽约时报畅销书榜之一 。于2005年6月由维京出版社出版。其中文版本由施清真译,繁体中文版本由台湾木马文化出
  • 北部九州北九州一般指的是九州北部的福冈县、佐贺县和长崎县。另在天气预报中,也包括山口县。不过有时熊本县并不在北九州之列,而划入南九州。在1963年北九州市成立前,多称呼此地区为北
  • 二极管电桥二极管电桥(diode bridge)是用四个或四个以上的二极管组成的电桥电路组态,不论输入电压的电极性(英语:Electrical polarity)是正是负,输出都可以维持相同的极性。二极管电桥最常见
  • 㵲阳河㵲阳河又名㵲水(又名舞水、午水),古称镇阳江、镇南江等。中国长江中游洞庭湖水系主要河流沅水上游支流之一,发源于贵州省瓮安县谷才村,经贵州黄平县、施秉县、镇远县、岑巩县和玉
  • 卡里亚语卡里亚语是印欧语系安那托利亚语族语言,在古代安纳托利亚西部的卡里亚地区由卡里亚人(英语:Carians)使用,与吕基亚语和弥吕亚语(英语:Milyan language)关系密切。相关文献为公元前7世纪至前3世纪。