率失真优化

✍ dations ◷ 2025-12-04 01:20:35 #影像编解码器,最优化算法,最优化,图像处理,编解码器,影像压缩技术

率失真优化(Rate–distortion optimization,简称RDO)是一种提升视频压缩性能的最优化方法。其原理是对视频的有损(画面质量)与比特率(编码所需的数据量)同时进行最优化,以求达到一个最佳的平衡点。虽然此算法一开始是在视频压缩的编码器中被使用,但也可以用于各种多媒体编码包含影像、视频、音频等等,只要编码时会同时考虑到质量及文件大小皆可使用。

传统视频编码器在做编码决策时,是挑选出影像质量最好的画面。然而只考虑质量的缺点是,会让决策的结果有时相较于质量稍差的选择下,花费了更多数据量但只相对提升了一点点质量。一个常见的例子就是动作补偿,尤其是使用1/4像素精确度的时候。在动作补偿过程中,为宏区块的动作向量增加额外的精确度可能可提升质量,但有些时候提升的质量,并不值得额外花费用来编码高精确度动作向量的数据量。

率失真优化借由作为影像质量的衡量方法,解决了上述的问题。数据量会被用比特数乘上拉格朗日乘数来取代。拉格朗日乘数代表了在某种程度范围的影像质量下,比特的花费与影像质量之间的关系。以数学式表示:

其中

为了最大化峰值信噪比的视频画值衡量,有损部分通常使用均方差做计算。

现行的视频压缩编解码器中,率失真优化需要将每一块视频画面的区块,经由熵编码器运算来衡量实际的比特花费,而此计算是复杂的。例如在MPEG的许多编解码器标准中,完整的计算流程包含了离散余弦变换、量化以及熵编码,需全部运算完才能得到实际的比特花费。因此率失真优化会较大部分其他的衡量方法来得慢,譬如绝对值差和(英语:sum of absolute differences)(SAD)和转换后绝对值差和(英语:sum of absolute transformed differences)(SATD)。因此率失真优化通常只在动作补偿的最后一个步骤才会被使用,像是在H.264/AVC中最后需要对各种分割模式下决定的时候。

相关

  • 安莫西林阿莫西林(amoxicillin),又译安莫西林或安默西林,本名羟氨苄青霉素,是一种常用的口服性广谱β-内酰胺类抗生素,具溶菌作用,主治易感微生物所引起的细菌性感染。本品为治疗中耳炎的第
  • 电负性电负性(英语:electronegativity,简写EN),也译作离子性、负电性及阴电性,是综合考虑了电离能和电子亲合能,首先由莱纳斯·鲍林于1932年提出。它以一组数值的相对大小表示元素原子在
  • 复演说复演说(英语:Recapitulation theory)是一个由德国生物学家恩斯特·海克尔主张的历史上的假说,称动物胚胎的发育过程,从受精到妊娠和孵化(个体发生学)会经历和该动物远古祖先成年个
  • 文具文具是给书写及其辅助工具的一个统称。在中国,毛笔、墨、纸、砚有文房四宝之称,除了砚可能现代人不用,其他的是写毛笔字时不可缺少的。 文具是每个人都需要的工具,学生学习的主
  • 四大奇书四大奇书有数种说法。中国章回小说《水浒传》、《三国演义》、《金瓶梅》、《西游记》的合称,李渔曰:“冯梦龙亦有四大奇书之目,曰三国也,水浒也,西游与金瓶梅也。”据李渔所说,是
  • 圣经之声广播电台圣经之声广播电台(英语:Bible Voice Broadcasting,简称BVB)是总部位于加拿大的基督教广播电台,开播于1979年。现拥有11种广播语言,用短波广播。1979年开始在黎巴嫩广播,最初呼号为
  • 化学物质毒性数据库化学物质毒性数据库(RTECS,Registry of Toxic Effects of Chemical Substances)是一个记录化学物质毒性资料的数据库。它的资料均来源于公开的科学文献,不过并没有指出那些研究
  • 51号兵站51号兵站可以指:
  • 北京语言大学出版社北京语言大学出版社简称北语社,成立于1985年,为北京语言大学下属出版社,也是中国唯一从事对外汉语教材研究与出版的专业出版社。该社目前出版汉语教材1600多种。在版权输出方面
  • 韩定食汤饭馔韩定食,中文又称韩式套餐,是朝鲜传统的套餐菜肴。原本是君王常食用的宫廷料理,后来士大夫模仿宫廷料理,开始配合各地特有的乡土饮食之后成为了班家料理。虽然不是个简单的