影像去背

✍ dations ◷ 2024-12-22 23:24:41 #影像科技

影像去背(英语:Image Matting),是指借由计算前景的颜色和透明度,将前景从影像中撷取出来的技术,可用于替换背景、影像合成、视觉特效,在电影工业中被广泛地使用。影像中的每个像素会有代表其前景透明度的值,称作阿法值(英语:Alpha),一张影像中所有阿法值的集合称作阿法遮罩(英语:Alpha Matte),将影像被遮罩所涵盖的部分取出即可完成前景的分离。

影像去背的主要工作就是求得精确的阿法遮罩,而影像常有无法人工标示的部分,例如:人的发丝或是动态模糊的部分,一种简单的解决方法是先人工标定出影像的“Trimap”,再由算法计算出阿法遮罩以完成影像去背。

阿法遮罩,是代表对于影像前景透明度的遮罩,大小和影像相同,遮罩中每个像素的值为相应的影像像素的阿法值(英语:Alpha)。阿法值为1代表该像素属于前景,0则代表该像素属于背景。阿法值也可能介于0,1之间,表示对应到的影像像素为半透明,例如烟雾、动态模糊。

一张影像的“Trimap”,是指将影像中的每个像素划分为三种区域:前景(英语: Foreground)、背景(英语:Background)和待确认(英语:Unknown)。算法会将标定好的前景和背景当成已知,再借由颜色等资讯将待确认区域中的像素标为前景或背景。

常见去背问题可分为单色去背(英语:Constant-color Matting)、差异去背(英语:Difference Matting)和自然影像去背(英语:Natural Image Matting)三种。

影像的背景为已知且为单一颜色,通常为较容易处理的蓝色或绿色。一般在拍摄电影,需要替换背景时,会在蓝幕或绿幕前拍摄,就是为了要将去背简化为最容易的单色去背,让后制的工作更容易且有效率。

影像的背景为已知但不是单色,可以先将相机固定,拍摄完已知的背景后,再拍摄加入人物的影像,把两影像相减后即可得到粗略的前景,故称之为差异去背。相减的方法虽然简单,但得出的前景再边界部分容易出错,可再借由算法进行优化。

影像的前景背景没有限制,是最一般化也最困难的去背问题。通常会由人工将影像标定为前景、背景和待确认三种区域,算法再由已知的前景、背景颜色,去推算待确认区域中的每个像素属于前景或是背景。

可大致分为两类:取样法(英语:Sampling-based)和传播法(英语:Propagation-based)。

取样法会对影像的局部区域取样,从已知资讯计算出该区域的阿法遮罩。常见的方法有贝式去背景法(英语:Bayesian Matting)。

传播法是指借由分析整张影像的特性,像是颜色、梯度等,来直接求得整张影像遮罩的方法。常见的方法有帕松去背景法(英语:Poisson Matting)、罗氏去背景法(英语:Robust Matting)等。

以贝氏几率模型计算最大后验概率,对前景、背景及阿法值同步进行优化,使用有向高斯共变异数(Oriented Gaussian Covariances)能有效的推估颜色的分布。贝氏去背的优点是几率模型简单又符合直觉,去背效果良好。其限制是需要良好的“Trimap”,当影像的前后景关系变得复杂时,贝氏去背的效果会显著下降。

帕松去背分为两步,一是从影像中算出遮罩近似的梯度场,二是借由解帕松等式(Poisson Equation),从遮罩的梯度场求得遮罩。当前景和背景颜色接近时,帕松去背容易出错,此时能够以更多的使用者输入,用区域的帕松去背来进行优化。

通常在有品质好的“Trimap”的情况下,取样法可以得到较好的遮罩;但在前后景关系复杂,“Trimap”品质不佳时,取样法的效果会迅速衰减。稳健性去背景法会先进行取样,得到遮罩后再进行优化,进而结合取样法和传播法的好处。

在实作上,可以借由增加观测资讯,让去背景变得更加容易。

在拍摄时,同时使用一般镜头和红外线镜头,借由红外线照片所得到的资讯,将同时拍摄的一般照片当中的人与背景分离。

在拍摄时,拍下使用闪光灯和没有使用闪光灯各一张,闪光灯会明显改变前景的亮度,但对背景的影响较小,借由分析有无闪光的两张照片,来完成影像去背。分析照片时能使用上述算法,如贝氏闪光去背(Joint Bayesian Flash Matting)。

相关

  • 非洲之角非洲之角(索马里语:Geeska Afrika;吉兹语:የአፍሪካ ቀንድ;阿拉伯语:القرن الأفريقي‎),有时按照其地理位置,又称东北非洲,作为一个半岛,则又称索马里半岛。非洲之角位
  • 失忆失忆症(Amnesia,来自希腊语ἀμνησία),又称失忆症候群(amnesic syndrome),是一种记忆混乱的疾病。简单来说就是丧失记忆,包含丧失部分记忆或丧失全部记忆。失忆症的成因包括器
  • 矿床学经济地质学,俗称矿床学,研究对经济工业有影响的地球资源。这些资源包括贵金属,基本金属,非金属矿产,建筑石材,油气,煤炭和水。
  • 恐慌恐慌是一种强烈的突然性的感觉。恐慌的出现会支配人的正常思维和逻辑,取而代之的是焦虑感和本能的战斗或逃跑的行动。恐慌很可能在大型团体聚会或人群中出现,从而造成大规模恐
  • 蔷薇果蔷薇果是果实的一种类型,属于聚合果,常见于蔷薇科植物。蔷薇果由若干瘦果聚集着生于凹陷的花萼中形成。聚合瘦果是与蔷薇果类似的另一类果实,它是由若干瘦果聚集着生于突起的花
  • 艺文志《艺文志》始见于班固《汉书》,删定刘歆《七略》而成,为后代正史“艺文志”之始祖。是史传书籍开创“九流十家”之祖,“九流十家”一词便出自《汉书艺文志略序》。相较于《史记
  • 费兹杰罗弗朗西斯·斯科特·基·菲茨杰拉德(英语:Francis Scott Key Fitzgerald,1896年9月24日-1940年12月21日),大陆译作弗朗西斯·斯科特·菲茨杰拉德,繁体译作費茨傑羅,简称斯科特·菲茨
  • 安纳乍伦府安纳乍伦府(泰语:จังหวัดอำนาจเจริญ,皇家转写:Changwat Amnat Charoen,泰语发音:),一译安纳乍仑府、安纳乍能府、庵纳乍伦府,是泰国东北部依善地区的一个府,与他相邻
  • 高风险家庭高风险家庭指的是家庭中出现家庭成员关系紊乱或家庭冲突:如家中成人时常剧烈争吵、无婚姻关系带年幼子女与人同居、或有离家出走之念头者等,以致影响儿童或青少年(儿少)日常生活
  • 五复合立方体在几何学中,五复合立方体,是一种由五个立方体组合成的星形多面体,其索引编号为UC9,是唯一五种正复合体之一。埃德蒙·赫斯在1876年首先描述了该复合体。五复合立方体的对偶多面