率失真优化

✍ dations ◷ 2025-08-10 19:08:58 #影像编解码器,最优化算法,最优化,图像处理,编解码器,影像压缩技术

率失真优化(Rate–distortion optimization,简称RDO)是一种提升视频压缩性能的最优化方法。其原理是对视频的有损(画面质量)与比特率(编码所需的数据量)同时进行最优化,以求达到一个最佳的平衡点。虽然此算法一开始是在视频压缩的编码器中被使用,但也可以用于各种多媒体编码包含影像、视频、音频等等,只要编码时会同时考虑到质量及文件大小皆可使用。

传统视频编码器在做编码决策时,是挑选出影像质量最好的画面。然而只考虑质量的缺点是,会让决策的结果有时相较于质量稍差的选择下,花费了更多数据量但只相对提升了一点点质量。一个常见的例子就是动作补偿,尤其是使用1/4像素精确度的时候。在动作补偿过程中,为宏区块的动作向量增加额外的精确度可能可提升质量,但有些时候提升的质量,并不值得额外花费用来编码高精确度动作向量的数据量。

率失真优化借由作为影像质量的衡量方法,解决了上述的问题。数据量会被用比特数乘上拉格朗日乘数来取代。拉格朗日乘数代表了在某种程度范围的影像质量下,比特的花费与影像质量之间的关系。以数学式表示:

其中

为了最大化峰值信噪比的视频画值衡量,有损部分通常使用均方差做计算。

现行的视频压缩编解码器中,率失真优化需要将每一块视频画面的区块,经由熵编码器运算来衡量实际的比特花费,而此计算是复杂的。例如在MPEG的许多编解码器标准中,完整的计算流程包含了离散余弦变换、量化以及熵编码,需全部运算完才能得到实际的比特花费。因此率失真优化会较大部分其他的衡量方法来得慢,譬如绝对值差和(英语:sum of absolute differences)(SAD)和转换后绝对值差和(英语:sum of absolute transformed differences)(SATD)。因此率失真优化通常只在动作补偿的最后一个步骤才会被使用,像是在H.264/AVC中最后需要对各种分割模式下决定的时候。

相关

  • 畏光感光性亦称光敏感度或光敏性(英语:Photosensitivity),是指一个物体在接收光子(多数时候为可见光)时的作用量。在医药学领域,该属于被用作指代皮肤对于光的不正常反应,通常又分为光照
  • sponge多孔动物门(学名:Porifera)为原始的多细胞生物,也称海绵动物门(Spongiatia或Spongia),一般称为海绵。海绵没有神经元/神经系统、消化和循环系统,相反,它们大多依靠海水流过自己的身体
  • 拉塞尼艾战役拉塞尼艾战役(俄语:Расейняйское сражение)是一场德国国防军第四装甲集团军(英语:4th Panzer Army)(由埃里希·霍普纳指挥)与苏联红军第3摩托化军(由艾列克西·
  • 人链人链是一种人们手拉手以显示团结的政治示威的形式。著名的人链事件,按年代顺序见下表:
  • 婚姻保护法案捍卫婚姻法案(英语:Defense of Marriage Act,简称DOMA)是一项美国联邦法律,允许各州拒绝承认在其它州合法的同性婚姻。直到这项法案的第三章在2013年被判定违宪前,捍卫婚姻法案让
  • 2020年马来西亚政治危机2020年马来西亚政治危机,是指在从2020年2月24日起,马来西亚执政党希望联盟政府所发生的执政危机。该危机目前仍持续进行中。2018年5月9日,马来西亚举行国会下议院第14届选举。
  • 加州海狮(Z. californianus)加州海狮(Zalophus californianus)是一种原产北太平洋的海狮品种。雄性长大后可达2.4米长,重300公斤;雌性长大后则有2米长,100公斤重。加州海狮的食物广泛,主要有鱼、鱿鱼等海鲜,偶
  • 桂柳话桂柳官话,系西南官话的一种,通行于广西北部汉语区。西南官话按照地域划分为成渝、滇西、黔北、昆贵、灌赤、鄂北、武门、岑江、黔南、湘南、桂柳十一片。广西的西南官话大部分
  • X射线管X射线管是能够发生X射线的一个设备或设备的部件。X射线管都包含阴极和阳极组件,其皆位于真空的材料密封罩内亦即为真空管。其是由钨丝绕成线圈的形式装在一个浅的聚焦杯(focus
  • 托马斯·荣托马斯·荣(Thomas Wing,1810年6月19日-1888年8月19日)是一名新西兰航海家、制图师、港口主任、飞行员。1810年出生于英格兰埃塞克斯郡的布莱德菲尔德村,1832年由伦敦出发驶往澳