帧内编码

✍ dations ◷ 2025-06-19 03:42:46 #帧内编码

高效率视频编码(HEVC)中的帧内编码(英语:Intra Coding,又称画面内编码)可以视为高阶视频编码(Advanced Video Coding,H.264/AVC)的扩展,因为他们都是利用空间上的取样预测来编码,而高效率视频编码的帧内编码包含以下基本元素:

此外,高效率视频编码中的帧内编码过程与帧间编码共享部分的处理步骤,包含转换(Transformation)、量化(Quantization)、熵编码(Entropy Coding)、降低区块的效应、取样自适应偏移(Sample Adaptive Offset)。

高阶视频编码的帧内编码是借由前一个解码影像区块且基于空间上的样本来推断,而高效率视频编码也沿用此准则,但是更进一步扩展至能够有效呈现更大范围的图像材质及结构的信息。高效率视频编码的帧内编码设计基于下列考量:

帧内编码使用的编码结构遵循边高效率视频编码的编解码器架构,图像会由编码树单元分割为数个(或不分割)编码单元、预测单元、转换单元,因为高效率视频编码包含上列提及的数种改善帧内编码的方式,因此可逐渐改变取样值使得不同方向的结构和区域更精准,而且借由参考样本的自适应平滑性和使直流(DC)、垂直、水平模式产生的预测边界样本平滑,可避免分区块编码所造成的边缘效应。

所有预测模式皆使用相同集合的参考样本(Reference Samples),而这些参考样本位于影像区块的左侧及上侧,在此定义参考样本为Rx,y,预测样本(Predicted samples)为Px,y,如图一所示。

位于图片或片(Slice)的边界或是被限制的编码单元边界,附近的参考样本可能无法使用,此时左边界的遗漏参考样本会由最近下面的参考样本产生,若是下边没有参考样本则使用上边的参考样本;相同地,上边界的遗漏参考样本会由最近左边的参考样本产生;若是没有任何参考样本可以使用,则所有样本被指定为比特深度的平均值。高效率视频编支持35种帧内预测模式,包含平面、直流、以及角度,帧内预测模式0为平面帧内预测,模式1为直流预测,模式2至34为角度预测模式,如图二所示。

高效率视频编码的角度帧内预测被设计成可以有效支持多种不同的方向结构,特别是针对影像及图片内容,会选择特定的帧内预测模式数量以及角度是为了在编码复杂度和编码效率中获取平衡,因此样本的预测程序会被设计成符合低运算量以及维持跨区块大小间及预测方向的一致性,也就是说可以最小化硬件实现上的芯片面积或是软件实践上的代码数量,以及更容易在不同环境下优化成高效率及高处理能力(Throughput)。在高效率视频编码中,共有4种有效的帧内预测区块大小-4×4至32×32,以及33种角度帧内预测模式,因此解码器必须支持132种区块大小和预测方向的组合。

对一般图片而言,垂直和水平的图形发生的频率会比其他方向的图形更高,这33种预测角度是根据观察而定义出优化精准度的集合,四分圆包含8个预测角度,如图二所示。对于垂直和水平的方向,有着小偏移参数可以提供垂直和水平图形更精确的预测,越靠近对角线,预测方向的偏移系数越大,对于使用频率较小的图形可以有效减少预测模式的密度。

高效率视频编码的帧内样本预测过程是由重建的参考样本以及固定方向推断,为了简化过程,根据选定的预测模式,在一个预测区块内的所有样本会被投影至单一的参考行或列,预测模式2至17会采用左边的参考行,预测模式18至34则会使用上方参考列。在一些情况下,被投影的像素位于负的座标轴上,此时参考的行或列会借由投影左边参考行至上方参考列或投影上方参考列至左边参考行来扩展,这样的方法只会造成压缩表现一点可被忽略的影响。图三描述扩展左边参考行至上方参考列。

假设每一预测样本Px,y由参考列投影而来,以及使用差值法得到1/32像素精准度,如下

Wy为两参考样本Ri,0和Ri+1,0的权重,>>代表比特向右位移,参考样本索引i和Wy借由投影位移d、选择的预测方向计算,而投影位移d范围是-32至32,&代表对每比特作按位与(AND)计算。

公式(1)和(2)定义在预测模式18至34如何获得预测样本值,而在预测模式2至17也是相同的推导方式,只要替换公式中的x和y。

当边缘出现时,虽然提供一有效的预测很重要,不是所有的图像内容会符合边缘模型(Edge Model),因此提供直流预测(DC Prediction)此一替换的模式,此模式致力于保持区块边界的连续性,其值为两线性预测的平均,如下:

高阶视频编码对于8×8的预测亮度区块采用三阶平滑滤波器(Three-tap Smoothing Filter),而高效率视频编码对于8×8及更大的预测亮度区块也采用相同的滤波器,第一个参考样本R0,2N和R2N,0不被过滤;对于32×32大小的区块,除了垂直和水平的所有角度模式皆使用一个过滤参考;在16×16大小的区块,这些不使用一个过滤参考的模式增加至4个模式(9、11、25、27),包含很接近水平和垂直的模式;此外,平滑滤波也使用在平面模式。根据选择的区块大小及预测方向采用参考样本平滑滤波,可以减少编码造成的边缘轮廓。

相关

  • 癌症治疗癌症免疫疗法(英语:cancer immunotherapy或immuno-oncology)是一类通过激活免疫系统来治疗癌症的方法。此类疗法采用了癌症免疫学(英语:Cancer immunology)研究的成果,这是肿瘤学中
  • 荷兰黄金时代在荷兰历史上,黄金时代(荷兰语:Gouden Eeuw,.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000",
  • β受体肾上腺素能受体(英语:Adrenergic receptors,或称为肾上腺素受体)是一类接受儿茶酚胺类物质刺激的代谢型G蛋白偶联受体,所接受的儿茶酚胺类主要是去甲肾上腺素以及肾上腺素。尽管
  • 控制理论控制理论是工程学与数学的跨领域分支,主要处理在有输入信号的动力系统的行为。系统的外部输入称为“参考值”,系统中的一个或多个变量需随着参考值变化,控制器处理系统的输入,使
  • 杜鲁门主义杜鲁门主义(英语:Truman Doctrine)是在美国总统杜鲁门任期内形成的美国对外政策,成为第二次世界大战后美国的对外政策核心。希腊内战期间,杜鲁门于1947年3月12日发表《国情咨文》
  • 林秋仙林秋仙(Lim Chiew Sien,1994年5月14日-),马来西亚女子羽毛球运动员。2014年9月,林秋仙代表马来西亚参加韩国仁川举行的亚运会羽毛球比赛。2016年林秋仙改打双打,期望可以取得更好的
  • 姬雉螺姬雉螺(学名:),是原始腹足目雉螺科雉螺属的一种。主要分布于台湾,常栖息在潮间带岩礁。
  • 游戏美工游戏美工是指电子游戏画面中的美术组成部分,如游戏的背景图、人物造型等。通常来说,游戏美术主要指游戏中独立的美术部分,如单独的背景图片、3D人物模型等。众多美术资源通过游
  • 肯尼迪航天中心39号发射台39号发射台(英语:Launch Complex 39,简称LC-39)是NASA肯尼迪航天中心的火箭发射场(英语:List of rocket launch sites),位于美国佛罗里达州的梅里特岛(英语:Merritt Island, Florida),由3个发射台、航天器装配大楼、轨道器处理厂(英语:Orbiter Processing Facility)、发射控制中心(英语:Launch Control Center)(含发射室)、新闻中心(标志性的倒计时牌)、以及众多后勤与工作大楼组成。LC-
  • 田口正治田口正治(日语:田口 正治/たぐち まさはる ,1916年1月9日-1982年6月29日),日本游泳选手。他于1936年夏季奥林匹克运动会中夺得4×200米自由泳接力金牌。1916年1月9日、田口正治出生于京都府。田口正治就读立教大学时参加1936年夏季奥林匹克运动会,他与游佐正宪、杉浦重雄、新井茂雄以2分14秒8获得4×200米自由泳接力金牌。他也因此获得1936年度朝日体育奖。立教大学毕业后,田口正治加入大丸(百货店)、担任大丸游泳部教练,指导古川胜、后藤忠治。1964年夏季奥林匹克运动会,田口正治担