率失真优化

✍ dations ◷ 2025-12-07 15:28:10 #影像编解码器,最优化算法,最优化,图像处理,编解码器,影像压缩技术

率失真优化(Rate–distortion optimization,简称RDO)是一种提升视频压缩性能的最优化方法。其原理是对视频的有损(画面质量)与比特率(编码所需的数据量)同时进行最优化,以求达到一个最佳的平衡点。虽然此算法一开始是在视频压缩的编码器中被使用,但也可以用于各种多媒体编码包含影像、视频、音频等等,只要编码时会同时考虑到质量及文件大小皆可使用。

传统视频编码器在做编码决策时,是挑选出影像质量最好的画面。然而只考虑质量的缺点是,会让决策的结果有时相较于质量稍差的选择下,花费了更多数据量但只相对提升了一点点质量。一个常见的例子就是动作补偿,尤其是使用1/4像素精确度的时候。在动作补偿过程中,为宏区块的动作向量增加额外的精确度可能可提升质量,但有些时候提升的质量,并不值得额外花费用来编码高精确度动作向量的数据量。

率失真优化借由作为影像质量的衡量方法,解决了上述的问题。数据量会被用比特数乘上拉格朗日乘数来取代。拉格朗日乘数代表了在某种程度范围的影像质量下,比特的花费与影像质量之间的关系。以数学式表示:

其中

为了最大化峰值信噪比的视频画值衡量,有损部分通常使用均方差做计算。

现行的视频压缩编解码器中,率失真优化需要将每一块视频画面的区块,经由熵编码器运算来衡量实际的比特花费,而此计算是复杂的。例如在MPEG的许多编解码器标准中,完整的计算流程包含了离散余弦变换、量化以及熵编码,需全部运算完才能得到实际的比特花费。因此率失真优化会较大部分其他的衡量方法来得慢,譬如绝对值差和(英语:sum of absolute differences)(SAD)和转换后绝对值差和(英语:sum of absolute transformed differences)(SATD)。因此率失真优化通常只在动作补偿的最后一个步骤才会被使用,像是在H.264/AVC中最后需要对各种分割模式下决定的时候。

相关

  • 躯干躯干是动物或人类身体的轴心。动物身体除了头颈部及肢体(包括翼、鳍)外,皆属躯干。人体躯干包括以横膈膜分界的胸部及腹部,包含了重要的身体器官。人体躯干正面由胸部及腹部组成
  • 普遍文法普遍文法(英语:universal grammar,缩写为 UG),又译为普遍语法,一种语言学理论,最有名的提倡者为乔姆斯基。这个理论认为在人类能够学习到各种文法的普遍能力,是被内建在大脑中的。它
  • 醚类醚(汉语拼音:mí,英语:Ether)是具有醚官能团的一类有机化合物。醚官能团是由一个氧原子连接两个烷基或芳基所形成,醚的通式为:R–O–R。它还可看作是醇或酚羟基上的氢被烃基所取代
  • 韩光渭韩光渭(英语:Kuang-Wei Han,1930年-2019年6月1日),中华民国海军少将退役,山东省即墨县人,已退休工程科学博士,是中华民国重要国防武器雄风导弹一型、二型计划主持人,被称为“雄风导弹
  • 美国通用英语通用美式英语(英语:General American,缩写为GA,或GenAm),又译为通用美国英语,是一种美式英语的标准化口音。它是一种概称,在其中涵括了多种美式英语的语言变体。起源于美国南部与美
  • Lol live tour 2018 -scream-‘’是日本唱跳团体lol在2019年1月30日发售的影像作品。
  • 三带金蛛三带金蛛(学名:)为园蛛科金蛛属的动物。分布于全球性分布以及中国大陆的海南、广东等地,多生活于田边的仙人掌上或杂草间。它在欧洲的某些地区被发现,包括伊比利亚半岛、加那利群
  • 乔恩·凯尔乔恩·卢埃林·凯尔(Jon Llewellyn Kyl,1942年4月25日-)是共和党籍政治人物,曾两度担任亚利桑那州参议员。凯尔生于内布拉斯加州的奥克兰市(Oakland),父亲是曾经担任爱荷华州众议员
  • Ae-45Aero 45是一款双活塞引擎全金属结构小型客机,是捷克斯洛伐克在战后第一款飞机,并取得相当成功,共生产了590架。机身结构为半硬壳式,座舱顶部由透明胶板压制而成,舱内设有通风、照
  • 莱姆多塔·斯特劳尤马莱姆多塔·斯特劳尤马(拉脱维亚语:Laimdota Straujuma、1951年2月24日-)是一位拉脱维亚政治家和经济学者。自2014年1月开始,她开始担任拉脱维亚总理一职。2011年至2014年,她曾担任