率失真优化

✍ dations ◷ 2025-07-08 17:31:37 #影像编解码器,最优化算法,最优化,图像处理,编解码器,影像压缩技术

率失真优化(Rate–distortion optimization,简称RDO)是一种提升视频压缩性能的最优化方法。其原理是对视频的有损(画面质量)与比特率(编码所需的数据量)同时进行最优化,以求达到一个最佳的平衡点。虽然此算法一开始是在视频压缩的编码器中被使用,但也可以用于各种多媒体编码包含影像、视频、音频等等,只要编码时会同时考虑到质量及文件大小皆可使用。

传统视频编码器在做编码决策时,是挑选出影像质量最好的画面。然而只考虑质量的缺点是,会让决策的结果有时相较于质量稍差的选择下,花费了更多数据量但只相对提升了一点点质量。一个常见的例子就是动作补偿,尤其是使用1/4像素精确度的时候。在动作补偿过程中,为宏区块的动作向量增加额外的精确度可能可提升质量,但有些时候提升的质量,并不值得额外花费用来编码高精确度动作向量的数据量。

率失真优化借由作为影像质量的衡量方法,解决了上述的问题。数据量会被用比特数乘上拉格朗日乘数来取代。拉格朗日乘数代表了在某种程度范围的影像质量下,比特的花费与影像质量之间的关系。以数学式表示:

其中

为了最大化峰值信噪比的视频画值衡量,有损部分通常使用均方差做计算。

现行的视频压缩编解码器中,率失真优化需要将每一块视频画面的区块,经由熵编码器运算来衡量实际的比特花费,而此计算是复杂的。例如在MPEG的许多编解码器标准中,完整的计算流程包含了离散余弦变换、量化以及熵编码,需全部运算完才能得到实际的比特花费。因此率失真优化会较大部分其他的衡量方法来得慢,譬如绝对值差和(英语:sum of absolute differences)(SAD)和转换后绝对值差和(英语:sum of absolute transformed differences)(SATD)。因此率失真优化通常只在动作补偿的最后一个步骤才会被使用,像是在H.264/AVC中最后需要对各种分割模式下决定的时候。

相关

  • 元音长度元音长度(英语:vowel length)是元音发音持续时间的长度。持续时间较普通元音发音时长的称为长元音;持续时间较短的元音称为短元音。国际音标对于长元音的标记方式,是在元音之后加
  • 小豆蔻小豆蔻(英语:Cardamom、学名:Elettaria cardamomum Maton),又名豆蔻、绿豆蔻、蔻米,是一种姜科多年生的草本植物。喜欢生长在山坡边阴凉潮湿的地方,中国的福建、广东、广西和云南都
  • 乙酰水杨酸铜乙酰水杨酸铜又称阿司匹林铜,是铜的乙酰水杨酸螯合物。它可用于治疗类风湿性关节炎。乙酰水杨酸铜可以通过多种方法制备。其中一种方法是将乙酰水杨酸溶解在碳酸钠溶液(或碳酸
  • 流放强迫他人流亡的刑罚称为流放。世界各国都有流放的刑罚,流放地通常是离岛或极为偏远的地方,使被流放的人难以返回原定居或活动的地方。如大英帝国时常流放罪犯到澳大利亚、俄罗
  • 葵涌街道葵涌街道是中国广东省深圳市龙岗区大鹏新区下辖街道,位于龙岗区东南部。辖区总面积103.9平方公里,下辖9个社区。常住人口10万人,其中户籍人口1.08万人。村落:海岸山山脉
  • 索尔福德大学索尔福德大学(University of Salford) 是一所位于英国大曼彻斯特索尔福德的公立研究型大学。主校区距离曼彻斯特市中心以西约1.5英里(2.4千米),处于艾尔维尔河沿岸。校门对面是工
  • 后秦后秦(384年-417年,或称姚秦)是十六国时期羌人贵族姚苌建立的政权。前秦苻坚淝水兵败后,关中空虚,原降于前秦的羌人贵族姚苌在渭北叛秦,晋太元九年(384年)自称“万年秦王”,都北地(今陕
  • 论语集释《论语集释》,程树德撰,是论语研究者的重要参考书。收集了清以前的重要论语注释,引用书籍达六百八十种,共一百四十万字。1943年由华北编译馆出版。中华书局于1990年、2013年、20
  • 分子食物分子食物(英语:Molecular gastronomy)又称为分子美食、分子料理,被人们称为未来食物、人造美食,所谓的分子食物是指把葡萄糖(C6H12O6)、维生素C(C6H8O6)、柠檬酸(C6H8O7)、麦芽糖
  • 约翰·D·麦克阿瑟约翰·唐纳德·麦克阿瑟(英语:John Donald MacArthur,1897年3月6日-1978年1月6日)是美国的商人和慈善家,和妻子凯瑟琳·T·麦克阿瑟一起成立了 麦克阿瑟基金会。1897年出生在宾夕