高斯金字塔

✍ dations ◷ 2025-07-14 12:55:02 #高斯金字塔

高斯金字塔(英文:Gaussian Pyramid)为在图像处理、计算机视觉、信号处理上所使用的一项技术。高斯金字塔本质上为信号的多尺度表示法,亦即将同一信号或图片多次的进行高斯模糊,并且向下取样,藉以产生不同尺度下的多组信号或图片以进行后续的处理,例如在影像辨识上,可以借由比对不同尺度下的图片,以防止要寻找的内容可能在图片上有不同的大小。高斯金字塔的理论基础为尺度空间理论,而后续也衍生出了多分辨率分析。

高斯金字塔背后的理论基础为尺度空间理论。这个的概念可以用在任意维度的信号中,不过最常用的地方还是在二维的影像信号上,以下将以二维影像信号作为主要讨论对象。给定一张图片 f ( x , y ) {displaystyle f(x,y)} L ( x , y ; t ) {displaystyle L(x,y;t)} 定义为:影像信号 f ( x , y ) {displaystyle f(x,y)} 和高斯函数 g ( x , y ; t ) = 1 2 π t e ( x 2 + y 2 ) / 2 t {displaystyle g(x,y;t)={frac {1}{2{pi }t}}e^{-(x^{2}+y^{2})/2t},} 的旋积。完整的式子为:

式中的分号代表旋积的对象为 x , y {displaystyle x,y} ,而分号右边的 t {displaystyle t} 表示定义的尺度大小。这个定义当 t 0 {displaystyle tgeq 0} 时对于所有的 t {displaystyle t} 都会成立,不过通常在实作上只会选取特定的 t {displaystyle t} 值。其中 t {displaystyle t} 为高斯函数的变异数。当 t {displaystyle t} 趋近于零的时候, g {displaystyle g} 成为一个单位脉冲响应,使得 L ( x , y ; t )   = f ( x , y ) {displaystyle L(x,y;t) =f(x,y)} ,这代表当 t = 0 {displaystyle t=0} 的时候我们可以把这项操作视为图片 f {displaystyle f} 本身。当 t {displaystyle t} 增加时, L {displaystyle L} 代表将影像 f {displaystyle f} 通过一个较大的高斯滤波器,从而使得影像的细节被去除更多。

根据尺度空间理论,假如限定从较精密的尺度推展到较粗糙的尺度的过程中,不能有新的结构被创造出来,那么高斯函数已经被证明出来为一个能够张成尺度空间的正则(Canonical)函数。

尺度空间的另外一种表现形式是将其视为一个扩散方程(举热传导方程式作为例子):

并且初始条件为 L ( x , y ; 0 ) = f ( x , y ) {displaystyle L(x,y;0)=f(x,y)} 。这个表示方式将图片上的内容视为温度的分布,并且将建立尺度空间表示形式的过程视为热传导随着时间 t {displaystyle t} 的扩散过程。另外,对于这种表现形式的仔细分析也统合了连续和离散尺度空间的理论,并且可以拓展到非线性的尺度空间。因此,我们可以说这种表示形式为尺度空间的基本。而高斯函数为此扩散方程的格林函数,也因此,在描述尺度空间表示方式和建立高斯金字塔时,会以高斯函数为主体。

在建立高斯金字塔的时候,我们首先会将影像转换为尺度空间的表示方式,亦即乘上不同大小的高斯函数,之后再依据取定的尺度向下取样。乘上的高斯函数大小和向下取样的频率通常会选为2的幂次,也就是说,在每次迭代的过程中,影像都会被乘上一个固定大小的高斯函数,并且被以长宽各0.5的比率被向下取样。如果将向下取样过程的图片一张一张叠在一起,会呈现一个金字塔的样子,因此这个过程称为高斯金字塔。

高斯金字塔的概念可以拿来进行边缘检测。高斯拉普拉斯算子(英文:Laplacian of Gaussian)为高斯金字塔的一个延伸,它可以作为加强影像边缘的一个带通滤波器。高斯拉普拉斯算子为影像通过高斯滤波器之后再通过拉普拉斯算子的结果:

然而,高斯拉普拉斯的结果会受到高斯函数的大小影响,为了去除这个影响,可以导入尺度归一化高斯拉普拉斯运算子

接着可以借由寻找 2 L {displaystyle nabla ^{2}L} 同时符合几何空间中和尺度空间中的局部极大值点,来寻找影像中的特征点。换句话说,对于输入影像 f ( x , y ) {displaystyle f(x,y)} ,我们可以借由建立起高斯金字塔,建出它在二维几何平面加上一维尺度空间共三维的空间,并且找出其亮度大于邻近26点的点作为特征点。

为了简化计算,我们可以将上述的热扩散函数带入高斯拉普拉斯算子,并进行近似以得到高斯差算子:

高斯差可以简单的透过将在尺度空间相邻的图片进行相减得到。这个方法被用在著名的尺度不变特征转换中:尺度不变特征转换借由寻找并描述不同尺度下的影像特征点,以进行不同影像之间的特征点比对。

相关

  • 砂浆砂浆是一种常见的建筑材料,由砂、水泥与水混合而成,有时亦会加入石灰,主要用作黏合砖块、瓦片等其他建筑材料的用途。用无机胶凝材料与细集料和水按比例拌和而成,也称灰浆。用于
  • 磷酸二氢铵磷酸二氢铵又称磷酸一铵,是一种白色的晶体,分子式为NH4H2PO4,可溶于水,微溶于乙醇。加热会分解成偏磷酸铵(NH4PO3),可用氨水和磷酸反应制成,主要用于制造肥料及灭火器。www.chemyq(中
  • 中臣镰足藤原镰足(614年-669年),曾名中臣镰足,字仲郎,古代日本中央的豪族,藤原氏的祖先。本为中臣御食子之子,初称中臣镰子,曾任神袛伯,后退宫,与轻皇子、中大兄皇子等人筹划大化改新。后推翻苏
  • 方塔纳市方塔纳(Fontana, California)是美国加利福尼亚州圣贝纳迪诺县的一个城市,位于该县西南部。面积107.485平方公里,2006年人口170,999人。1913年开埠,1952年6月25日建市。
  • 普鲁斯霍塔姆纳加尔普鲁斯霍塔姆纳加尔(Purushottamnagar),是印度马哈拉施特拉邦Nandurbar县的一个城镇。总人口3594(2001年)。该地2001年总人口3594人,其中男性1919人,女性1675人;0—6岁人口370人,其中
  • 大米策尔堡湖坐标:53°39′05″N 14°17′04″E / 53.65130254069°N 14.28445816°E / 53.65130254069; 14.28445816大米策尔堡湖(德语:Großer Mützelburger See),是德国的湖泊,位于该国东
  • 哇哇映画哇哇映画私人有限公司,简称哇哇映画(英语:Wawa Pictures Pte Ltd),在2007年9月,由资深电视节目、电视连续剧制作人刘健财(Molby Low Kian Chye),于新加坡(总部)成立。业务在全球经营制
  • 朱迪·科默朱迪·玛丽·科默(英语:Jodie Marie Comer,1993年3月11日-),是一位英国女演员,她在BBC美国台的大热剧集《杀死伊芙》中饰演女杀手薇拉内尔(Villanelle),并凭借这一角色收获了国际知名
  • 刘扬扬刘扬扬(英语:Liu Yang-Yang,韩语:유양양;2000年10月10日-),艺名扬扬(英语:Yangyang,韩语:양양),出生于台湾新北市,为在中国及韩国发展的男歌手、Rapper,SM娱乐旗下韩国男子团体NCT成员。2019
  • 美并村 (岐阜县) */?)是日本岐阜县郡上郡(日语:郡上郡)内一个已撤销的村,面积达79.81平方公里,据2003年10月1日的统计,人口为5,106人,1954年11月1日由同郡下川村(日语:下川村 (岐阜県))与嵩田村(日语:嵩田村)合并而成,名称源于狭长的两村均是隔住长良川并排在一起,希望能够永远整齐地并排在一起(将来永久に美しく並びたい),加上位处于郡上郡南面,而南在日语中的读法与美并相同,同时美字也是美浓国的首字而得名:774,2004年3月1日与同郡白鸟町、八幡町、大和町、高鹫村、明宝村(日语:明宝村)、和良