取样自适应偏移

✍ dations ◷ 2025-11-11 23:45:11 #取样自适应偏移

取样自适应偏移(英语:Sample Adaptive Offset,缩写:SAO)为H.265/高效率视讯编码内嵌式滤波器的一种,其余两种内嵌式循环滤波器分别是:去区块效应滤波器(Deblocking Filter)、调适性循环滤波器(Adaptive Loop Filter)。

高效率视讯编码使用4x4至32x32大小的转换单元,而H.264/高阶视讯编码使用的转换单元不超过8x8,越大的转换单元会产生更多的假影(Artifacts)包含量化所造成的振铃现象;此外,高效率视讯编码8阶分数亮度取样差值和4阶分数彩度取样差值,而H.264/高阶视讯编码分别使用6阶分数亮度取样差值和2阶的分数彩度取样差值,越高阶的取样差值会造成越严重的振铃现象(Ringing Artifacts),因此高效率视讯编码需要引入新的内嵌式循环滤波器,除了开发去区块效应滤波器,更进一步引入全新概念的取样自适应偏移滤波器。取样自适应偏移借由类重建的样本为数个类来降低取样的失真,过程中会取得每一类的偏移量,然后再将偏移量分别加到每一类里的样本,而每一类的偏移量会在编码器里适当地计算出且明确地将资讯给解码器,以有效降低取样失真,为了节省边资讯(Side Information),样本类会在编码器和解码器中实现;为了在只有一编码树单元的情况下达到低延迟,基于编码树单元的句法被设计成可以指定取样自适应偏移的系数,此基于编码树单元最佳化算法可以导出每一编码树单元的取样自适应偏移系数,并且将取样自适应偏移系数交错放入边资料(Slide Data)。

取样自适应偏移会根据样本的类和适用的区域而使用不同的偏移量,两种取样自适应偏移型态可以满足高效率视讯编码对于低运算量的要求,分别是:边缘偏移、带偏移,边缘偏移的样本类是基于比较当前样本以及邻近样本,而带偏移的样本类是基于样本值。为达到低编码延迟以及减少缓冲区的使用量,类区域的大小会固定成一个编码树区块的大小,若要再降低边资讯的资料量,可以合并多个编码树单元共用取样自适应偏移参数。

为了保持运算复杂度和编码效率的平衡,边缘偏移使用4种样本类的一维方向图形,分别为:水平、垂直、135度对角、45度对角,如图一所示,"c"代表当前的样本,"a"和"b"则代表邻近的样本,每一种模式分别对应图一的4种图形。在编码时,每一编码树区块只能选择一种边缘偏移类,且基于优化失真率的考量,最佳的边缘偏移类会以位元流(Bitstream)当作边资讯传送,又因为这些边缘偏移图形都是一维,所以类的结果不会确切地和临界样本相关。

对于一个给定的边缘偏移类(Class),在编码树区块内的每个样本会被分为5种形态(Category)中的其一,当前样本"a"会根据选择的一维方向模式和两相邻样本"b"、"c"比较,比较的规则如下表:

型态1及4分别关联相对低值和相对峰值,型态2及3分别关联凹面及凸面,若当前样本无法归于上面4种型态,则为型态0且将不适用取样自适应偏移。这4种型态的意义以及其正负值如图二表示,在边缘偏移型态1和2中使用正偏移使得相对低值及凹面更平滑,若是使用负偏移则会使的图形更尖锐;而在边缘偏移型态3和4中使用负偏移使得相对峰值及凸面更平滑,使用正偏移则更尖锐。

图三说明了著名的吉布斯现象(Gibbs Phenomenon),可以用来模拟一些影像压缩的假象,特别是振铃现象(Ringing Artifacts),虽然水平轴和垂直轴没有特别标记,但分别定义沿着一维路径的样本位置和样本值,虚线代表原始的样本,有色的实心圆代表相对低值、相对峰值、凸面、和凹面,其余样本则为空心圆。若在相对峰值、凸面使用负偏移,而在相对低值、凹面使用正偏移,可以有效减少失真。

带偏移为增加一偏移量至同一带上的所有样本,样本的值域被等分为32带,一个8位元样本的值域为0到255,其宽度为8,取样值从8k至8k+7属于带k,而k的范围是0至31,而解码器会得知在同一带中原始样本和重建样本的平均差。解码器只有4个连续带和起始带位置的偏移资讯,为了减少线性缓冲区的需求,这些由解码器可取得的偏移量数目由16减少至4,而此数目正好相等于解码器可得到的边缘偏移量数目;而另一个会选择只有4个带的理由是这些区域经由图片从四元树分割成编码树区块而减少时,可以有效限制在一个区域中的取样范围。

一张图片会被切割成多层的四元树区域,为了决定取样自适应偏移的系数,下列为处理的过程:

以下说明如何从取样自适应偏移编码器的四元树切割得到统计资料,Nl,i,t,c为在阶层l、区域i、类t、型态c的像素数目,al,i,t,c为相对应的偏移,el,i,t,c为相对应原始讯号和重建讯号差的合,Rl,i,t为相关偏移的预测率,借由使用收集到的统计资料,可以利用简单的式子计算出预测的失真减少量,Dl,i,t为阶层l、区域i、类t、型态c的预测失真减少量。

 Dl,i,t =                                                     c                        t                                {displaystyle sum _{cin t}}  (Nl,i,t,ca2l,i,t,c - 2al,i,t,cel,i,t,c)(1)

得知预测失真减少量之后,我们可以计算出位元率-失真成本(Rate-Distortion-Cost),λ为拉格朗日乘数。

 Jl,i,t = Dl,i,t + λRl,i,t(2)

编码器会根据式子(4)选择有最低位元率-失真成本且在阶层l、区域i的类,T为取样自适应偏移类的集合。

 Jl,i =                               min                      t                        T                                {displaystyle min limits _{tin T}}  (Jl,i,t)(3) tl,i =                     arg                          min                      t                        T                                {displaystyle arg min limits _{tin T}}  (Jl,i,t)(4)

得到最低位元率-失真成本以及最佳取样自适应偏移类之后,编码器会尝试合并子区域成一个父区域,J’l,t和t’l,i分别是合并后的位元率-失真成本以及选择的取样自适应偏移类,Ωl,i是阶层l和区域i的集合。

 J'l,i =                     min              {displaystyle min }  (                                                    k                                      Ω                              l                                      ,            i                                {displaystyle sum _{kin Omega _{l},i}}   Jl+1,k,Jl,i)(5) t'l,i =                     arg                min              {displaystyle arg min }  (                                                    t                        T                                {displaystyle sum _{tin T}}   Jl+1,k,Jl,i)(6)

根据合并子区域后的结果,相关父区域的分离资讯由以下公式决定:

                               S                      l                          ,        i        =                              {                                                            1                  ,                                                                                            if                                                                                                                       k                                                                    Ω                                                  l                                                                    ,                      i                                                                            J                                          l                                                                            +                  1                  ,                  k                  <                                      J                                          l                                                                            ,                  i                                                                              0                  ,                                                                                            otherwise                                                                                                                             {displaystyle S_{l},i={begin{cases}1,&{mbox{if }}sum _{kin Omega _{l},i}J'_{l}+1,k<J'_{l},i\0,&{mbox{otherwise }}end{cases}}}  

Sl,i为1代表当前区域会被切割成若干个子区域,为0则代表当前区域不会被切割,处理所有阶层k的区域后,编码器会继续处理阶层k-1的区域直到阶层0的区域,最后使用决定的取样自适应偏参数更新每一区域的解码器图像缓冲区。

相关

  • 陆 林陆林(1966年9月-),安徽安庆人,精神病学与临床心理学家,中国科学院院士,现任北京大学第六医院院长。1989年,毕业于华北煤炭医学院(现华北理工大学)。1999年,在华西医科大学(现四川大学)获
  • 锺开莱钟开莱(Kai Lai Chung,1917年9月19日-2009年6月2日),浙江杭州人,生于上海,卒于菲律宾罗哈斯。华裔数学家、世界著名概率专家,“概率学界学术教父”。钟开莱1917年生于上海,浙江杭州人
  • 金华猪金华猪,又称为金华两头乌,是中国地方猪品种之一。金华猪原产于浙江金衢盆地。金华猪耳下垂,头颈部及臀尾部为黑色,身体其余部位为白色。尾巴较长、直。金华猪因毛色而得名“两头
  • 帕尔瓦特帕尔瓦特(Parvat),是印度古吉拉特邦Surat县的一个城镇。总人口20694(2001年)。该地2001年总人口20694人,其中男性12235人,女性8459人;0—6岁人口3100人,其中男1678人,女1422人;识字率63
  • 蔡锦青蔡锦青,字芥舟,清朝官员,监生出身,惠州府归善县(今惠州市惠东县)人。生于嘉庆十八年(1813年),道光年间初任江西都昌县知县,历任江西吴城镇分防知府,同治二年(1863年)署江西广饶九南兵备道
  • 跟你说,听你说102万张唱片销售量 (国际唱片业协会- 台湾)《跟你说 听你说》 (英语:Talk to You, Listen to You)是台湾女歌手陈淑桦的第28张专辑,发行于1989年11月2日,由滚石唱片公司发行与制作,唱片编号:RD-1051。专辑中的三个主打歌:《梦醒时分》,《你走你的路》,《傲慢与偏见》是她的经典著名作品。
  • 2008年日本周末电影票房冠军列表我是传奇 | 地球 | 魔街理发师 | 魔街理发师向着阴天绽放 | L change the WorLd | L change the WorLd | L change the WorLd魔幻罗盘 | 大雄与绿之巨人传 | 曼哈顿奇缘 | 大雄与绿之巨人传 | 大雄与绿之巨人传科洛弗档案 | 剧场版 假面骑士电王&Kiva 巅峰刑事(日语:劇場版 仮面ライダー電王&キバ クライマックス刑事) | 名侦探柯南:战栗的乐谱 | 名侦探柯南:战栗的乐谱相棒剧场版 国际象棋杀人事件 | 相棒剧场版 国际象棋杀人事
  • 蓝弧文化广州蓝弧文化传播有限公司(英语:Bluearc Animation Studio,简称蓝弧文化、蓝弧)创建于2003年,是一家在中国大陆动漫业界有着重要影响的文化传媒公司,主要从事动画连续剧、电影、网络剧的制作发行及其衍生品的开发。截至2016年,蓝弧文化制作发行了超过20部动画连续剧及电影,作品总时长超过35000分钟。其制作的《洛洛历险记》《果宝特攻》《超兽武装》等多部作品电视收视率、视频网站点击量在中国大陆名列前茅。2014年,蓝弧公司估值逾4亿元,位居中国动漫企业前列。蓝弧文化曾几度易主,期间其经
  • 湘军南京屠城湘军南京屠城发生于1864年7月,曾国藩弟曾国荃率湘军攻破太平天国天京(今南京)后纵火杀掠,屠杀平民总计死者约二、三十万人(死亡人数有争议)。自六朝以建康为首都起,南京被战火屠戮约七、八次,其中南朝梁的侯景之乱(今南京),以及湘军南京屠城规模较大。1853年3月19日(咸丰三年二月十日)太平军攻克江宁(今南京市),两江总督陆建瀛及副都统霍隆武阵亡。为镇压太平天国,湖南(湘)长沙曾国藩、曾国荃兄弟、曾国藩姻亲罗泽南家族、新宁江忠源家族等统领的乡勇组成湘军。咸丰八年(1858年)四月,湘军李续宾部攻破江西九江
  • 张璀张璀(?-17世纪),字望之,号知非,福建泉州府同安县人,明朝、南明政治人物。崇祯三年庚午科举人,七年(1634年)甲戌科进士,刑部观政,初授赵州知州,八年补授广东万州知州,在当地建社学十余所,革除槟榔税;黎族入侵,他用计擒拿首领。不久,贬扬州通判,迁琼州推官,处置当地虐民的土豪;陞南京户部主事、员外郎,揭发奸臣钱弊,得敕到广东收取粮饷;隆武年间擢任户部江西司郎中,很快辞官回归。