非等向性扩散

✍ dations ◷ 2025-02-24 23:18:39 #Image processing,Image noise reduction techniques

在影像处理及电脑视觉领域中,Anistropic Diffusion(非等向性扩散)是一项用来减少影像噪声但却不会影响到影像中较重要成分的技术,像是边界、线条或者影像中较明显的细节。一般影像扩散处理是将原始影像与二维高斯滤波器进行卷积,这种扩散处理是线性且具有空间不变性的转换。而非等向性扩散处理则是会根据影像产生区域性的滤波器,再将原始影像与产生的滤波器进行卷积,所以非等向性扩散是一种非线性且不具有空间不变性的转换。

Perona和Malik在1987年提出不具有空间不变性的滤波器时,其原始的概念是等向性扩散但会根据影像内容产生不同的滤波器,这也使得在靠近边界的区域其产生的滤波器会很类似狄拉克δ函数,让边界及影像中较重要的结构能够在经过扩散处理后还能保留下来。而当初Perona和Malik称之为非等向性扩散,即使其产生的区域性滤波器是具有等向性的,而当时这种处理又被称为不均匀扩散、非线性扩散及Perona-Malik扩散。而实际上的非等向性扩散则是根据边界及结构的方向而产生非等向性的区域性滤波器,这种方法又被称为shape-adapted smoothing或coherence enhancing diffusion。其产生的影像可以同时进行平滑化并保留原本影像的结构,而这类方法所使用的扩散方程式通常是根据在原始影像中的位置及原始影像的像素值所产生。

虽然其结果是由原始影像及区域性滤波器卷积所产生,但实际应用上这样会需要大量的运算,所以通常会用近似法来进行加速,也就是说每一张新的影像是由上一张产生的影像套用非等向性扩散所产生。整体来说,非等向性扩散是一种迭代性的处理,其产生的结果会越来越平滑直到达到所需要的结果。

Ω R 2 {\displaystyle \Omega \subset \mathbb {R} ^{2}} 代表的是平面上的子集合,且 I ( , t ) : Ω R {\displaystyle I(\cdot ,t):\Omega \rightarrow \mathbb {R} } 是一组灰阶影像,则非等向性扩散可以定义为

Δ {\displaystyle \Delta } 代表的是拉普拉斯运算子, {\displaystyle \nabla } 代表的是梯度运算子, d i v ( ) {\displaystyle \mathrm {div} (\dots )} 则是散度运算子,而 c ( x , y , t ) {\displaystyle c(x,y,t)} 代表的是扩散系数. c ( x , y , t ) {\displaystyle c(x,y,t)} 控制扩散的程度,而且通常是根据影像梯度所产生的方程式,所以能够保存原本影像中的边界。 Pietro Perona 和 Jitendra Malik 在1990年最早提出非等向性扩散的概念,且提出了两种计算扩散系数的方程式:

常数K控制方程式对于边界的敏感度,而其值通常是根据影像中的噪音所产生,或者根据实验所产生。

M {\displaystyle M} 代表的是平滑的影像,则上面的扩散方程式就可以被转换成用梯度下降法寻找方程式 E : M R {\displaystyle E:M\rightarrow \mathbb {R} } 的最小能量,而 E : M R {\displaystyle E:M\rightarrow \mathbb {R} } 则定义为

其中 g : R R {\displaystyle g:\mathbb {R} \rightarrow \mathbb {R} } 是一个实数函数,其代表的是扩散系数之间的关系。对于可微函数 h {\displaystyle h}

假设 E I {\displaystyle \nabla E_{I}} 代表 E 对 L 2 ( Ω , R ) {\displaystyle L^{2}(\Omega ,\mathbb {R} )} 内积的梯度,则

因此,其梯度下降法的方程式可以表示成

我们假设 c = g {\displaystyle c=g'} 就可以得到非等向性方程式了。

修正后的Perona-Malik模型,又被成为正规化的P-M方程式,其未知部分在非线性部分与高斯函数进行卷积,得到

其中 G σ = C σ ( 1 / 2 ) e x p ( | x | 2 / 4 σ ) {\displaystyle G_{\sigma }=C{\sigma }^{-\left(1/2\right)}exp\left(-|x|^{2}/4{\sigma }\right)} .

正规化虽然可以增加其稳定性,但同时也会产生模糊效果,所以要在事前得知噪音的程度才能够决定正规化的所需要的常数。

非等向性扩散可以用来减少数位影像的噪声而不会模糊其边界。如果在固定的扩散系数下,非等向性扩散方程式所减少的heat equation与高斯模糊是相同的,但这样会在消除噪声时同时模糊边界。如果扩散系数是根据边界侦测方程式来决定,像是Perona Malik 模型的话,其结果会在区域内进行扩散而且不会使其超过较强的边界,因此在移除噪声后,影像中的边界及结构仍可以保留下来。

除了移除噪声之外,非等向性扩散也可以用于边界侦测。只要根据边界侦测方程式来进行多次递回的非等向性扩散,其最终结果影像会趋向于剩下一个一个的色块,而相邻色块之间的区域则会被侦测为边界。

相关

  • 养猪业猪生产学是动物科学的一个重要分支,主要研究养猪生产中的各种理论和技术。根据食用习惯和市场需求的不同,一般可分为脂肪型、瘦肉型和肉脂兼用型。猪只的各部分也可以加工,作为
  • 理中丸理中丸,源于《伤寒论》。《金匮要略》中人参汤,即将本方改作汤剂。
  • 唐宁街10号坐标:51°30′12″N 0°07′40″W / 51.503396°N 0.127640°W / 51.503396; -0.127640唐宁街10号(英语:10 Downing Street),位于英国首都伦敦西敏市西敏区白厅旁的唐宁街,一所乔
  • 六阶六边形镶嵌在几何学中,六阶六边形镶嵌是由六边形组成的双曲面正镶嵌图,在施莱夫利符号中用{6,6}表示。六阶六边形镶嵌即每个顶点皆为六个六边形的公共顶点,顶点周围包含了六个不重叠的六
  • 五十K五十K是一种扑克玩法,起源自浙江温岭,之后流行于中国各地成为常见扑克游戏之一。其特点在于以五、十、K三张牌同时出示为最大。除非有“炸”(四张一样的牌同出)。三张牌一个花色
  • 白圻白圻(1466年-1517年),字辅之,直隶常州府武进县人,明朝政治人物。成化二十年(1484年)甲辰科进士。授南京户部主事,历官浙江布政使司参议,奏免长兴县被灾田赋。累迁都察院右副都御史、总
  • 倒垂莲定式倒垂莲定式是一类围棋定式的统称,因白子若倒垂莲花得名。该定式考验对弈双方水平,中国古代座子棋制度下,较多出现在让子局中。现代围棋对抗中属于场合性下法,一般用于考验对手棋
  • 佩达纳佩达纳(Pedana),是印度安得拉邦Krishna县的一个城镇。总人口29535(2001年)。该地2001年总人口29535人,其中男性14773人,女性14762人;0—6岁人口3527人,其中男1850人,女1677人;识字率59.
  • 地球攻击命令 哥斯拉对盖刚《地球攻击命令 哥斯拉对盖刚》是1972年上映的日本电影,哥斯拉系列电影的第12部作品,小高源吾是个喜爱怪兽的漫画家,但是自己所创作的怪兽往往不被自己的上司所欣赏,某天一个怪
  • 鬼魅的大窗子《鬼魅的大窗子》(英语:The Wide Window)是雷蒙尼·史尼奇作品《波特莱尔大遇险》系列的第三部小说。在这本书中,波特莱尔三姐弟被送去与新监护人约瑟芬姑妈(Aunt Josephine)住在