非等向性扩散

✍ dations ◷ 2025-08-26 09:53:20 #Image processing,Image noise reduction techniques

在影像处理及电脑视觉领域中,Anistropic Diffusion(非等向性扩散)是一项用来减少影像噪声但却不会影响到影像中较重要成分的技术,像是边界、线条或者影像中较明显的细节。一般影像扩散处理是将原始影像与二维高斯滤波器进行卷积,这种扩散处理是线性且具有空间不变性的转换。而非等向性扩散处理则是会根据影像产生区域性的滤波器,再将原始影像与产生的滤波器进行卷积,所以非等向性扩散是一种非线性且不具有空间不变性的转换。

Perona和Malik在1987年提出不具有空间不变性的滤波器时,其原始的概念是等向性扩散但会根据影像内容产生不同的滤波器,这也使得在靠近边界的区域其产生的滤波器会很类似狄拉克δ函数,让边界及影像中较重要的结构能够在经过扩散处理后还能保留下来。而当初Perona和Malik称之为非等向性扩散,即使其产生的区域性滤波器是具有等向性的,而当时这种处理又被称为不均匀扩散、非线性扩散及Perona-Malik扩散。而实际上的非等向性扩散则是根据边界及结构的方向而产生非等向性的区域性滤波器,这种方法又被称为shape-adapted smoothing或coherence enhancing diffusion。其产生的影像可以同时进行平滑化并保留原本影像的结构,而这类方法所使用的扩散方程式通常是根据在原始影像中的位置及原始影像的像素值所产生。

虽然其结果是由原始影像及区域性滤波器卷积所产生,但实际应用上这样会需要大量的运算,所以通常会用近似法来进行加速,也就是说每一张新的影像是由上一张产生的影像套用非等向性扩散所产生。整体来说,非等向性扩散是一种迭代性的处理,其产生的结果会越来越平滑直到达到所需要的结果。

Ω R 2 {\displaystyle \Omega \subset \mathbb {R} ^{2}} 代表的是平面上的子集合,且 I ( , t ) : Ω R {\displaystyle I(\cdot ,t):\Omega \rightarrow \mathbb {R} } 是一组灰阶影像,则非等向性扩散可以定义为

Δ {\displaystyle \Delta } 代表的是拉普拉斯运算子, {\displaystyle \nabla } 代表的是梯度运算子, d i v ( ) {\displaystyle \mathrm {div} (\dots )} 则是散度运算子,而 c ( x , y , t ) {\displaystyle c(x,y,t)} 代表的是扩散系数. c ( x , y , t ) {\displaystyle c(x,y,t)} 控制扩散的程度,而且通常是根据影像梯度所产生的方程式,所以能够保存原本影像中的边界。 Pietro Perona 和 Jitendra Malik 在1990年最早提出非等向性扩散的概念,且提出了两种计算扩散系数的方程式:

常数K控制方程式对于边界的敏感度,而其值通常是根据影像中的噪音所产生,或者根据实验所产生。

M {\displaystyle M} 代表的是平滑的影像,则上面的扩散方程式就可以被转换成用梯度下降法寻找方程式 E : M R {\displaystyle E:M\rightarrow \mathbb {R} } 的最小能量,而 E : M R {\displaystyle E:M\rightarrow \mathbb {R} } 则定义为

其中 g : R R {\displaystyle g:\mathbb {R} \rightarrow \mathbb {R} } 是一个实数函数,其代表的是扩散系数之间的关系。对于可微函数 h {\displaystyle h}

假设 E I {\displaystyle \nabla E_{I}} 代表 E 对 L 2 ( Ω , R ) {\displaystyle L^{2}(\Omega ,\mathbb {R} )} 内积的梯度,则

因此,其梯度下降法的方程式可以表示成

我们假设 c = g {\displaystyle c=g'} 就可以得到非等向性方程式了。

修正后的Perona-Malik模型,又被成为正规化的P-M方程式,其未知部分在非线性部分与高斯函数进行卷积,得到

其中 G σ = C σ ( 1 / 2 ) e x p ( | x | 2 / 4 σ ) {\displaystyle G_{\sigma }=C{\sigma }^{-\left(1/2\right)}exp\left(-|x|^{2}/4{\sigma }\right)} .

正规化虽然可以增加其稳定性,但同时也会产生模糊效果,所以要在事前得知噪音的程度才能够决定正规化的所需要的常数。

非等向性扩散可以用来减少数位影像的噪声而不会模糊其边界。如果在固定的扩散系数下,非等向性扩散方程式所减少的heat equation与高斯模糊是相同的,但这样会在消除噪声时同时模糊边界。如果扩散系数是根据边界侦测方程式来决定,像是Perona Malik 模型的话,其结果会在区域内进行扩散而且不会使其超过较强的边界,因此在移除噪声后,影像中的边界及结构仍可以保留下来。

除了移除噪声之外,非等向性扩散也可以用于边界侦测。只要根据边界侦测方程式来进行多次递回的非等向性扩散,其最终结果影像会趋向于剩下一个一个的色块,而相邻色块之间的区域则会被侦测为边界。

相关

  • 胞嘧啶胞嘧啶(英语:cytosine, C),学名为2-羰基-4-氨基嘧啶,是组成DNA的四种基本碱基之一。胞嘧啶核苷、胞嘧啶核苷酸均可作为升高白细胞(白血球)的药物。可由二巯基脲嘧啶、浓氨水和氯乙
  • 欧亚经济共同体欧亚经济共同体(英语:Eurasian Economic Community,缩写EAEC或EurAsEC;俄语:Евразийское экономическое сообщество),起源于独立国家联合体的成
  • 达戈贝尔特二世圣达戈贝尔特二世(法语:Dagobert II,652年-679年12月23日),法兰克王国墨洛温王朝的奥斯特拉西亚国王(676年—679年12月23日在位)。达戈贝尔特二世是奥斯特拉西亚国王西吉贝尔特三世
  • 茱蒂·戴维斯茱蒂·戴维斯(英语:Judy Davis,1955年4月25日-),澳洲女演员,曾凭《印度之行》和《贤伉俪》分别提名奥斯卡最佳女主角奖和奥斯卡最佳女配角奖。
  • 兰盖期兰盖期(英语:Langhian)是中新世的第三个阶段。其起止时间为15.97百万年前和13.82百万年前。
  • 碳-1212C是质量数为12的碳原子,其质子数和中子数都为6,它是碳元素的一种同位素,在世界现存碳元素中占比98.89%,是最常见的碳同位素。在2019年5月20日国际单位制基本单位的重新定义之
  • 乌尔扎巴巴乌尔扎巴巴(约公元前2340年前后在位)(英语:Ur-Zababa)基什第四王朝末代国王。他被萨尔贡废黜,后者建立阿卡德帝国。
  • 新海灌区新海灌区,是台湾台北盆地西南部的一个灌溉区域,其水源主要为大汉溪与一小部分新店溪。新海灌区又可细分为“新庄灌区”与“海山灌区”,海山灌区包括新北市的土城、板桥、中和、
  • 无论何时。Million(日本唱片协会)《无论何时。》(日语:どんなときも。),日本男性创作歌手槙原敬之的第3张单曲。1991年6月10日发行。是槙原敬之的成名作和迄今销量最高的单曲。槙原敬之的成
  • 卡利克拉提斯 (亚该亚)卡利克拉提斯(Callicrates of Leontium)亲罗马的亚该亚政治家,反对吕克尔塔斯(英语:Lycortas)(波利比阿之父)的政见。公元前179年出任亚该亚同盟将军。