率失真优化

✍ dations ◷ 2025-05-17 12:06:32 #影像编解码器,最优化算法,最优化,图像处理,编解码器,影像压缩技术

率失真优化(Rate–distortion optimization,简称RDO)是一种提升视频压缩性能的最优化方法。其原理是对视频的有损(画面质量)与比特率(编码所需的数据量)同时进行最优化,以求达到一个最佳的平衡点。虽然此算法一开始是在视频压缩的编码器中被使用,但也可以用于各种多媒体编码包含影像、视频、音频等等,只要编码时会同时考虑到质量及文件大小皆可使用。

传统视频编码器在做编码决策时,是挑选出影像质量最好的画面。然而只考虑质量的缺点是,会让决策的结果有时相较于质量稍差的选择下,花费了更多数据量但只相对提升了一点点质量。一个常见的例子就是动作补偿,尤其是使用1/4像素精确度的时候。在动作补偿过程中,为宏区块的动作向量增加额外的精确度可能可提升质量,但有些时候提升的质量,并不值得额外花费用来编码高精确度动作向量的数据量。

率失真优化借由作为影像质量的衡量方法,解决了上述的问题。数据量会被用比特数乘上拉格朗日乘数来取代。拉格朗日乘数代表了在某种程度范围的影像质量下,比特的花费与影像质量之间的关系。以数学式表示:

其中

为了最大化峰值信噪比的视频画值衡量,有损部分通常使用均方差做计算。

现行的视频压缩编解码器中,率失真优化需要将每一块视频画面的区块,经由熵编码器运算来衡量实际的比特花费,而此计算是复杂的。例如在MPEG的许多编解码器标准中,完整的计算流程包含了离散余弦变换、量化以及熵编码,需全部运算完才能得到实际的比特花费。因此率失真优化会较大部分其他的衡量方法来得慢,譬如绝对值差和(英语:sum of absolute differences)(SAD)和转换后绝对值差和(英语:sum of absolute transformed differences)(SATD)。因此率失真优化通常只在动作补偿的最后一个步骤才会被使用,像是在H.264/AVC中最后需要对各种分割模式下决定的时候。

相关

  • 马德里三一一连环爆炸案马德里三一一连环爆炸案(西班牙语:Atentados del 11 de marzo de 2004;常被简称为11-M)是指一系列发生在2004年3月11日针对西班牙首都马德里市郊铁路系统的恐怖主义炸弹袭击。在
  • 蕨菜蕨菜,是可食用蕨类植物嫩卷芽的通称。蕨菜在台湾俗称蕨猫,常以台语转写为“过猫”。常见的蕨菜包括欧洲蕨及其变种(Pteridium aquilinum (L.) Kuhnsub sp. Latiusculum (Desv.)
  • 铣床铣床是一种主要用于金属切削的机床,于1818年由包括埃里·惠特尼在内的数位美国机械工程师共同发明。以铣刀作为刀具加工工件表面这种方法叫做铣削。铣床用来切削平面,或者用特
  • 埔里盆地群埔里盆地群是台湾位于南投县中央地带分布着大小不等的数十座盆地,其中以埔里盆地为埔里盆地群是面积最大,故以此命名。埔里盆地群的分布,除了埔里、草湳两座盆地是在埔里境内,还
  • 信仰治疗信仰治疗(英语:Faith healing),是指透过祈祷或宗教灵修的方式,对生理或心灵上的疾病,借着上帝或神灵的力量,进行医治及治疗。一些意见认为,宗教治疗的疗效,能间接提供有上帝或超自然
  • 晋州邢氏晋州邢氏(韩语:진주 형씨 ),以大韩民国庆尚南道晋州市为本贯的姓氏。始祖邢颙,唐太宗贞观八年(634年)以高句丽荣留王请的唐八学士之一人入居平壤定着。官至三韩壁上功臣、三重大匡
  • 基尔肯尼基尔肯尼(英语:Kilkenny;爱尔兰语:Cill Chainnigh),是爱尔兰基尔肯尼郡的一个城镇,位于诺尔河(英语:River Nore)畔。2016年的总人口为26512人。该城镇为基尔肯尼郡郡治。基尔肯尼镇的
  • 埃尔莫劳·巴尔巴罗埃尔莫劳·巴尔巴罗(英语:Ermolao Barbaro,1454年-1493年),文艺复兴时期欧洲威尼斯的人文主义者和外交家。曾出版校订和评注希腊古典作家的著作。他最著名的著作是《普林尼著作校
  • 忒修斯之船忒修斯之船(英语:ship of Theseus),亦称忒修斯悖论,是一种同一性的悖论。1世纪时的希腊作家普鲁塔克提出了这个问题:如果忒修斯的船上的木头逐渐被替换,直到所有的木头都不是原来的
  • PRISTINPRISTIN(朝鲜语:프리스틴 )为韩国Pledis娱乐于2017年推出的10人女子偶像团体,成员包括娜荣、Roa、Yuha、银雨、Rena、洁琼、Yehana、成娫、施妍、Kyla。团体名称取为PRISTIN一