率失真优化

✍ dations ◷ 2025-12-08 13:07:14 #影像编解码器,最优化算法,最优化,图像处理,编解码器,影像压缩技术

率失真优化(Rate–distortion optimization,简称RDO)是一种提升视频压缩性能的最优化方法。其原理是对视频的有损(画面质量)与比特率(编码所需的数据量)同时进行最优化,以求达到一个最佳的平衡点。虽然此算法一开始是在视频压缩的编码器中被使用,但也可以用于各种多媒体编码包含影像、视频、音频等等,只要编码时会同时考虑到质量及文件大小皆可使用。

传统视频编码器在做编码决策时,是挑选出影像质量最好的画面。然而只考虑质量的缺点是,会让决策的结果有时相较于质量稍差的选择下,花费了更多数据量但只相对提升了一点点质量。一个常见的例子就是动作补偿,尤其是使用1/4像素精确度的时候。在动作补偿过程中,为宏区块的动作向量增加额外的精确度可能可提升质量,但有些时候提升的质量,并不值得额外花费用来编码高精确度动作向量的数据量。

率失真优化借由作为影像质量的衡量方法,解决了上述的问题。数据量会被用比特数乘上拉格朗日乘数来取代。拉格朗日乘数代表了在某种程度范围的影像质量下,比特的花费与影像质量之间的关系。以数学式表示:

其中

为了最大化峰值信噪比的视频画值衡量,有损部分通常使用均方差做计算。

现行的视频压缩编解码器中,率失真优化需要将每一块视频画面的区块,经由熵编码器运算来衡量实际的比特花费,而此计算是复杂的。例如在MPEG的许多编解码器标准中,完整的计算流程包含了离散余弦变换、量化以及熵编码,需全部运算完才能得到实际的比特花费。因此率失真优化会较大部分其他的衡量方法来得慢,譬如绝对值差和(英语:sum of absolute differences)(SAD)和转换后绝对值差和(英语:sum of absolute transformed differences)(SATD)。因此率失真优化通常只在动作补偿的最后一个步骤才会被使用,像是在H.264/AVC中最后需要对各种分割模式下决定的时候。

相关

  • 吡唑吡唑既可以用来指一类简单的芳香杂环有机化合物,它们都是含有五元环,包括三个碳原子和相邻的两个氮原子,也可以用来指这一类化合物的母体,即没有任何取代基。尽管在自然界中很难
  • 1770年孟加拉饥荒1770年孟加拉饥荒(孟加拉语: ৭৬-এর মন্বন্তর, Chhiattōrer monnōntór; 或简写为The Famine of '76)是1769年到1773年(在孟加拉历为1176到1180年)之间所发生的一场
  • 立秋数据来源:喷气推进实验室线上历书系统立秋,是二十四节气之一,每年在8月7-9日之间,太阳位于黄经135°。立秋是二十四节气中的第十三个节气。每年8月7日或8日太阳到达黄经135度时
  • 香山香山位于北京的西北部,是西山的余脉,占地约2400余亩,主峰是鬼见愁,海拔557米。2012年10月以闻名于世的香山红叶入选世界名山。香山是三山五园组成部分之一,清代构成西北皇家园林
  • 万户万户(英语:Wan Hu,?-?),一作万虎,是传说中中国明朝的一个官吏,根据作品描述“是历史上首位尝试用火箭升空的人”。现存中国历史资料中尚未发现关于万户的记载。美国国家航空航天局曾将
  • 仁牙因湾战役(1944年-45年)仁牙因湾战役,也称林加延湾战役是第二次世界大战中盟军在菲律宾群岛的一次登陆作战,在1945年1月9日早上由祖斯·B·奥登多夫指挥盟军舰队驶向仁牙因湾海岸,美国海
  • 2008年中国矿难列表2008年,中国大陆共发生煤矿重特大事故38起,死亡707人,同比起数增加10起,死亡人数增加134人。
  • 三口瓶三颈瓶是实验室中常用玻璃容器,多用在需要同时处理多样程序,但又需要在封闭系统中进行的反应。圆型的底,上方开三个颈、口,多以Pyrex玻璃为材料。 可接分液漏斗、温度计、回流
  • 李蓓芬李蓓芬(1950年4月-),上海人,中华人民共和国政治人物、外交官。曾任外交部新闻司处长、参赞。2004年,接替王信石担任中华人民共和国驻贝宁大使。期间被授予贝宁国家荣誉勋章。2008
  • Manz AGManz AG,也称Manz Automation,是一家成立于1987年的德国跨国高科技设备制造公司,总部位于德国罗伊特林根城。Manz AG公司专精于提供先进的生产设备解决方案,包括自动化、激光加