率失真优化

✍ dations ◷ 2025-12-06 20:23:11 #影像编解码器,最优化算法,最优化,图像处理,编解码器,影像压缩技术

率失真优化(Rate–distortion optimization,简称RDO)是一种提升视频压缩性能的最优化方法。其原理是对视频的有损(画面质量)与比特率(编码所需的数据量)同时进行最优化,以求达到一个最佳的平衡点。虽然此算法一开始是在视频压缩的编码器中被使用,但也可以用于各种多媒体编码包含影像、视频、音频等等,只要编码时会同时考虑到质量及文件大小皆可使用。

传统视频编码器在做编码决策时,是挑选出影像质量最好的画面。然而只考虑质量的缺点是,会让决策的结果有时相较于质量稍差的选择下,花费了更多数据量但只相对提升了一点点质量。一个常见的例子就是动作补偿,尤其是使用1/4像素精确度的时候。在动作补偿过程中,为宏区块的动作向量增加额外的精确度可能可提升质量,但有些时候提升的质量,并不值得额外花费用来编码高精确度动作向量的数据量。

率失真优化借由作为影像质量的衡量方法,解决了上述的问题。数据量会被用比特数乘上拉格朗日乘数来取代。拉格朗日乘数代表了在某种程度范围的影像质量下,比特的花费与影像质量之间的关系。以数学式表示:

其中

为了最大化峰值信噪比的视频画值衡量,有损部分通常使用均方差做计算。

现行的视频压缩编解码器中,率失真优化需要将每一块视频画面的区块,经由熵编码器运算来衡量实际的比特花费,而此计算是复杂的。例如在MPEG的许多编解码器标准中,完整的计算流程包含了离散余弦变换、量化以及熵编码,需全部运算完才能得到实际的比特花费。因此率失真优化会较大部分其他的衡量方法来得慢,譬如绝对值差和(英语:sum of absolute differences)(SAD)和转换后绝对值差和(英语:sum of absolute transformed differences)(SATD)。因此率失真优化通常只在动作补偿的最后一个步骤才会被使用,像是在H.264/AVC中最后需要对各种分割模式下决定的时候。

相关

  • McKinsey Company麦肯锡公司(英语:McKinsey & Company,简称麦肯锡)为一所由芝加哥大学会计系教授詹姆斯·麦肯锡创立于芝加哥的管理咨询公司,营运重点是为企业或政府的高层干部献策、针对庞杂的经
  • 粘蛋白黏液素(英语:Mucins,或简称黏素)是一类高分子量蛋白家族,且高度糖基化(属于糖缀合物(英语:glycoconjugate)),在大部分后生动物的上皮组织中都有表达。黏液素的特色是它可以构成胶状物;因
  • 罗马帝国政府古罗马政府与政治 系列条目罗马共和国前509年–前27年 罗马帝国前27年–1453年元首制西罗马帝国君主制东罗马帝国王政时代宪政(英语:Constitution of the Roman Kingdom) 共和
  • 萨福萨福(古希腊文:Σαπφώ;拉丁化:Sappho,约前630年代-前570年代),古希腊的女同性恋诗人,一生写过不少情诗、婚歌、颂神诗、铭辞等。著有诗集九卷,大部分已散轶,现仅存一首完篇、三首几
  • 里部里部,为汉字索引中的部首之一,康熙字典214个部首中的第一百六十六个(七划的则为第二十个)。就繁体和简体中文中,里部归于七划部首。里部只以下方为部字。且无其他部首可用者将部
  • 萝莉咖啡店由东立出版社出版的《萝莉咖啡店》第1本漫画封面《萝莉咖啡店》(少女カフェ)是板仓梓的日本四格漫画作品,中文版由东立出版社代理发行。本作于芳文社旗下《Manga Time Lovely》
  • I'm GoodI'm Good是韩国女子组合T-ara中的咸�晶以艺名Elsie个人出道的第一张迷你专辑。I'm Good由MBK Entertainment在2015年5月9日正式发行。主打歌I'm Good请来K.Will共同演唱。4
  • 于莱努尔梅坐标:58°18′58″N 26°43′17″E / 58.31611°N 26.72139°E / 58.31611; 26.72139于莱努尔梅(爱沙尼亚语:Ülenurme)是爱沙尼亚的城镇,位于该国东南部,由塔尔图县负责管辖,是于
  • 全球重要农业文化遗产中国项目以下是经联合国粮食及农业组织确定的全球重要农业文化遗产中国项目(截止2014年5月):
  • 磁镜磁镜是由两个电流方向相同的线圈以中轴重合的方式排列形成的一种磁场构形,磁场在每个线圈的中心处最强,在线圈中间最弱。带电粒子在磁镜场中运动时,粒子的磁矩是一定的,在磁场强