率失真优化

✍ dations ◷ 2025-11-26 13:02:44 #影像编解码器,最优化算法,最优化,图像处理,编解码器,影像压缩技术

率失真优化(Rate–distortion optimization,简称RDO)是一种提升视频压缩性能的最优化方法。其原理是对视频的有损(画面质量)与比特率(编码所需的数据量)同时进行最优化,以求达到一个最佳的平衡点。虽然此算法一开始是在视频压缩的编码器中被使用,但也可以用于各种多媒体编码包含影像、视频、音频等等,只要编码时会同时考虑到质量及文件大小皆可使用。

传统视频编码器在做编码决策时,是挑选出影像质量最好的画面。然而只考虑质量的缺点是,会让决策的结果有时相较于质量稍差的选择下,花费了更多数据量但只相对提升了一点点质量。一个常见的例子就是动作补偿,尤其是使用1/4像素精确度的时候。在动作补偿过程中,为宏区块的动作向量增加额外的精确度可能可提升质量,但有些时候提升的质量,并不值得额外花费用来编码高精确度动作向量的数据量。

率失真优化借由作为影像质量的衡量方法,解决了上述的问题。数据量会被用比特数乘上拉格朗日乘数来取代。拉格朗日乘数代表了在某种程度范围的影像质量下,比特的花费与影像质量之间的关系。以数学式表示:

其中

为了最大化峰值信噪比的视频画值衡量,有损部分通常使用均方差做计算。

现行的视频压缩编解码器中,率失真优化需要将每一块视频画面的区块,经由熵编码器运算来衡量实际的比特花费,而此计算是复杂的。例如在MPEG的许多编解码器标准中,完整的计算流程包含了离散余弦变换、量化以及熵编码,需全部运算完才能得到实际的比特花费。因此率失真优化会较大部分其他的衡量方法来得慢,譬如绝对值差和(英语:sum of absolute differences)(SAD)和转换后绝对值差和(英语:sum of absolute transformed differences)(SATD)。因此率失真优化通常只在动作补偿的最后一个步骤才会被使用,像是在H.264/AVC中最后需要对各种分割模式下决定的时候。

相关

  • 平流层平流层(英语:Stratosphere),旧称同温层,位于对流层的上方和中间层的下方。其下界在中纬度地区位于距离地表10km处,在极地则在8km左右,其上界则约在离地50km的高度。平流层的温度上
  • 洛克菲勒洛克菲勒(英文:Rockefeller)可以指:
  • 正丙醇1-丙醇(Propan-1-ol)是一种有三个碳原子的醇类有机化合物。 简单的化学式为C3H7OH。分子式为CH3CH2CH2OH,依按IUPAC命名法称作丙-1-醇。是一氧化碳和氢合成甲醇时的副产物。其
  • 国际透明组织透明国际(英语:Transparency International)是一个监察贪污腐败的国际非政府组织。从1995年起,透明国际制定和每年公布腐败感知指数,提供一个可供比较的国际贪污状况列表。透明国
  • 亚里斯多德物理学古希腊哲学家亚里士多德(公元前384年-前322年)开创许多 有关物理学本质的理论。这些理论涉及到他所描述的四大元素。他阐明这些元素间的密切联系,它们的动力,它们对地球的影响,以
  • 马克·奥利芬特马库斯·劳伦斯·艾尔文·奥利芬特AC KBE FRS FAA FTSE(英语:Sir Marcus Laurence Elwin "Mark" Oliphant,1901年10月8日-2000年7月14日),也称马克·奥利芬特是澳大利亚的物理学家
  • 三一学堂坐标:52°12′21″N 0°06′58″E / 52.20583°N 0.11611°E / 52.20583; 0.11611 (Trinity Hall)剑桥大学三一学堂(英语:Trinitiy Hall,又称剑桥大学三一堂学院)是剑桥大学其中
  • 大瘟疫伦敦大瘟疫是一场1665年至1666年间发生在英国的大规模传染病爆发,超过10万人死于这次瘟疫之中,足足相当于当时伦敦人口的五分之一。该次的疾病后来被确认为是淋巴腺鼠疫,一种由
  • 细胞色素b5结构 / ECOD细胞色素b5(英语:Cytochrome b5)是一种存在于动物、植物、真菌以及紫色光养菌中遍及的电子传递血红素蛋白。该细胞色素于微粒体及线粒体中的变体是与膜相结合的,而细
  • 肌研肌研(日语:ハダラボ)是一系列由日本乐敦制药所生产的女性用化妆品。肌研是由日本乐敦制药位于日本京都的“乐敦京都科研村”产业研究实验室所在2004年配置出来的。产品开发负责