引导影像滤波器

✍ dations ◷ 2025-11-20 17:34:14 #非线性滤波器,图像处理,计算机图形学

在图像处理上，引导影像滤波器（英语：Guided Image Filter）是一种能使影像平滑化的非线性滤波器。

与双边滤波器（Bilateral Filter）相同，这个影像滤波器同样能够在清楚保持影像边界的情况下，达到让影像平滑的效果。

但不同于双边滤波器，引导影像滤波器有两个优点：首先，双边滤波器有非常大的计算复杂度，但引导影像滤波器因为并未用到过于复杂的数学计算，有线性的计算复杂度。再来，双边滤波器因为数学模型的缘故，在某些时候会发生梯度反转（gradient reverse）的状况，出现影像有损；而在引导影像滤波器，因为这个滤波器在数学上以线性组合为基础出发，输出图片（Output Image）必与引导图片（Guidance Image）的梯度方向一致，并不会出现梯度反转的问题。

为了达到将影像平滑化、即去除噪声的效果，首先定义输出的结果图片是输入图片减去噪声后的结果；同时，为了让输出的图片符合引导图片的影像边界，将输出图片定为引导图片的线性组合。

以下为引导影像滤波器的基础模型：

(1)　　 $q_{i}=p_{i}-n_{i}$ $q_{{i}}=p_{{i}}-n_{{i}}$

(2)　　 $q_{i}=aI_{i}+b$ $q_{{i}}=aI_{{i}}+b$

在上述公式中， $q_{i}$ $q_{{i}}$ 是第i个输出的像素， $p_{i}$ $p_{{i}}$ 是第i个输入的像素， $n_{i}$ $n_{i}$ 是第i个输入像素的噪声成分， $I_{i}$ $I_{{i}}$ 是第i个引导图片的像素， $a, b {\displaystyle a,b}$ $a, b$ 则是用来衡量输入权重的参数。

定义为线性组合（Linear Combination）的原因在于，一对象的边界与其梯度（Gradient）相关，而在线性组合的定义下，输出图片之梯度必与引导图片之梯度成对比（微分时高幂次系数保留而常量项则被去除），故可以达到保留梯度的效果、保留影像边界的目的。

为了导出上述线性组合的参数，将(1)及(2)相减得到公式(3)；同时，定义一个代价方程式(cost function)(4)：

(3)　　 $n_{i}=p_{i}-aI_{i}-b$ $n_{{i}}=p_{{i}}-aI_{{i}}-b$

(4)　　 $E(a_{k},b_{k})=\sum _{i{\epsilon }{\omega }_{k}}^{}((a_{k}I_{i}+b_{k}-p{i})^{2}+{\epsilon }a_{k}^{2})$ $E(a_{k},b_{k})=\sum _{i{\epsilon }{\omega }_{k}}^{}((a_{k}I_{i}+b_{k}-p{i})^{2}+{\epsilon }a_{k}^{2})$

在上式中， $\epsilon$ $\epsilon$ 是一用来惩罚（penalize）过大的 $a_{k}$ $a_{k}$ 的参数， $\omega _{k}$ $\omega _{k}$ 是以第 $k {\displaystyle k}$ $k$ 个像素为中心点的窗格（window）。

在这个方程式中可以看到，希望同时让最终的输出图片做到让噪声减少以及让引导图片在输出图片的影响减小（引导图片的系数项）两件事，遂定义每个像素噪声和系数项的平方总合为最后须付出的价值项（cost）。并且，基于让价值项最小化的原则，可以将(4)以线性回归（linear regression）的方法找出它的线性模型，从而求得、使得出它的价值方程式有最小解的到以下两参数 $a_{k}$ $a_{k}$ 和 $b_{k}$ $b_{k}$ ：

(5)　　 $a_{k}={\frac {{\frac {1}{\omega }}\sum _{i\epsilon \omega _{k}}I_{i}p_{i}-\mu _{k}{\bar {p_{k}}}}{\sigma _{k}^{2}+\epsilon }}$ $a_{k}={\frac {{\frac {1}{\omega }}\sum _{i\epsilon \omega _{k}}I_{i}p_{i}-\mu _{k}{\bar {p_{k}}}}{\sigma _{k}^{2}+\epsilon }}$

(6)　　 $b_{k}={\bar {p_{k}}}-a_{k}\mu _{k}$ $b_{k}={\bar {p_{k}}}-a_{k}\mu _{k}$

在这里， $\mu _{k}$ $\mu _{k}$ 和 $\sigma _{k}^{2}$ $\sigma _{k}^{2}$ 分别是引导图片 $I {\displaystyle I}$ $I$ 在窗格 $\omega _{k}$ $\omega _{k}$ 的平均数（mean）和标准差（variance），而 ${\bar {p}}_{k}={\frac {1}{\left|\omega \right|}}\sum _{i\epsilon \omega _{k}}p_{i}$ ${\bar {p}}_{k}={\frac {1}{\left|\omega \right|}}\sum _{i\epsilon \omega _{k}}p_{i}$ 是在窗格 $\omega _{i}$ $\omega _{{i}}$ 中像素的平均值；这两项系数，换句话说，即是一以输入图片为考虑计算权重之平均滤波器（weighted mean）。

依据上式，可以列出此滤波器之算法：

Algorithm 1. 引导图片滤波器

输入：输入图片 $p {\displaystyle p}$ $p$ ，引导图片 $I {\displaystyle I}$ $I$ ，窗格半径 $r {\displaystyle r}$ $r$ ，修正项 $\epsilon$ $\epsilon$

输出：输出图片 $q {\displaystyle q}$ $q$

第一部分

 $mean_{I}$  $mean_{I}$  =  $f_{mean}(I)$  $f_{mean}(I)$  $mean_{p}$  $mean_{p}$  =  $f_{mean}(p)$  $f_{mean}(p)$  $corr_{I}$  $corr_{I}$  =  $f_{mean}(I.*I)$  $f_{mean}(I.*I)$  $corr_{Ip}$  $corr_{Ip}$  =  $f_{mean}(I.*p)$  $f_{mean}(I.*p)$

第二部分

 $var_{I}$  $var_{I}$  =  $corr_{I}-mean_{I.}*mean_{I}$  $corr_{I}-mean_{I.}*mean_{I}$  $cov_{Ip}$  $cov_{Ip}$  =  $corr_{Ip}-mean_{I.}*mean_{p}$  $corr_{Ip}-mean_{I.}*mean_{p}$

第三部分

 $a {\displaystyle a}$  $a$  =  $cov_{Ip}./(var_{I}+\epsilon )$  $cov_{Ip}./(var_{I}+\epsilon )$  $b {\displaystyle b}$  $b$  =  $mean_{p}-a.*mean_{I}$  $mean_{p}-a.*mean_{I}$

第四部分

 $mean_{a}$  $mean_{a}$  =  $f_{maean}(a)$  $f_{maean}(a)$  $mean_{b}$  $mean_{b}$  =  $f_{maean}(b)$  $f_{maean}(b)$

第五部分

 $q {\displaystyle q}$  $q$  =  $mean_{a.}*I+mean_{b}$  $mean_{a.}*I+mean_{b}$

/* $f_{mean}$ $f_{mean}$ 是一个有线性计算复杂度的平均滤波器（mean filter）*/

引导图片滤波器保留边界的特性，其实也可以被理解为是保留梯度的特性。由下图可以看到，可以将一张图分为细节图层和基底图层两层，基底图层的能量并无小幅度的升降，只有大幅度诸入梯度的能量升降；而细节图层，只有噪声式的小幅度能量升降。而引导图片滤波器所作的，其实就是将细节层和基底层分离并保留基底层，也就是保留梯度而去除噪声，达到平滑效果。

由引导图片滤波器的特性，可以延伸出除了原先的平滑化外的几项功能

当一影像图同时为输出图片和引导图片时，可知最终得到的会是以该图片的边界为依据的基底层和细节层；因此，若要加强依影像之细节，可以将细节层的能量放大n倍后再次叠加回基底层，以达到增强细节的效果。

无论是利用光场（light field）技术或是焦点合成（focal-stack）所制作的深度图（depth map），在出制作完成时往往都会有一些坑洞（holo）；而这时若使用引导影像滤波器，以原始影像为引导图片、以深度图为输入图片，便可得到一完整、无坑洞的深度图。

相关

国际健康功能与身心障碍分类系统国际健康功能与身心障碍分类（英语：International Classification of Functioning, Disability, and Health，简称ICF），这项健康分类系统经过世界卫生组织九年的修订协调，终于在2001
果酱果酱（英语：jam、法语：confiture），以水果、蔬菜、食糖、蜂蜜和果胶制成，经常可长期进行罐装或密封储存。在全球制作了许多果酱品种，包含如草莓、杏黄、番茄和南瓜的甜果酱，其使用原料
莲雾莲雾（学名：Syzygium samarangense），新加坡和马来西亚一带叫做水蓊，又名天桃，别名辇雾、琏雾、爪哇蒲桃、洋蒲桃，是桃金娘科的常绿小乔木。因其果实长得像铃铛，亦称为bell-fruit。原
不可分空间在拓扑学中，带有密着拓扑（trivial topology）的拓扑空间是其中仅有的开集是空集和整个空间的空间。这种空间有时叫做不可分空间（indiscrete space），它的拓扑有时叫做不可分拓扑。在
阿道夫·威廉·赫尔曼·科尔贝阿道夫·威廉·赫尔曼·科尔贝（德语：Adolph Wilhelm Hermann Kolbe，又译柯尔伯、柯尔贝、科尔被，1818年9月27日－1884年11月25日），德国化学家。科尔贝生于汉诺威王国哥廷根附近的艾
准卫星准卫星是与行星有着1:1轨道共振，在公转许多次后便会接近行星并留驻的天体。准卫星绕太阳公转的轨道周期与行星相同，但是有着不同的离心率（通常更大），如右图所示。当从行星上观察
蓝丝绒《蓝丝绒》（英语：Blue Velvet）是1986年由大卫·林奇编导的美国悬疑电影，成功结合了黑色电影与超现实主义元素。电影由凯尔·麦克拉兰、伊莎贝拉·罗塞里尼、丹尼斯·霍柏与劳拉
雪兰莪坐标：3°20′N 101°30′E / 3.333°N 101.500°E / 3.333; 101.500雪兰莪（马来语：Selangor，英语音标：/səˈlæŋə/; 马来语: ；简称雪州），马来西亚十三州之一，位于马来半岛西海岸
锡酸锡酸（英语：stannic acid）是一种含锡无机酸，其化学式为H2SnO3。锡酸拥有类似于碳酸的结构，不易溶于水，可溶于有机物如丙酮，溶解后可解离成锡酸根离子（SnO32-），也同样拥有类似碳酸根的共
第十海峡军团第十海峡军团（拉丁语：Legio X Fretensis）古罗马军队建制名称。由屋大维于公元前41年（一说公元前40年）建立并存在至公元410年后。该军团曾先后参加亚克兴战役、犹太战争等一系列相