视频质量是量化一段视频通过视频传输/处理系统时画面质量变化(通常是下降)程度的方法。由于视频处理系统可能会导致一定的视频信号失真,因此视频质量评价对于视频传输/处理系统的选择,显得十分重要。
自从世界上第一段视频被录制以来,各种各样的视频处理系统都被设计生产。在模拟视频系统时期,评估视频处理系统的质量可使其播放一些"传统测试信号",并计算其频率响应得到。(比如一系列的色条与圆圈)
如今,数字视频已经取代模拟视频,评价的方法也随之改变。数字视频处理系统的性能显著地取决于输入视频的动态特性(如动作或空间细节)。
客观视频评估技术是一些与主观质量评估结果相近的数学模型,但是它们通常由计算机按照一定的标准与指标自动完成。评价的方法大致是将原视频(高品质、一般不被压缩)与处理后的视频进行分类对比。分类对比分为三种:全参考(FR)、部分参考(RR)、无参考(NR)。全参考比较处理前后的两段视频每个像素的差别,部分参考提取两段视频的一些特性,并依此给予它们评分。以上两种方法通常在原视频可用时使用,如在有限的带宽下。无参考则试图在没有任何原视频的参考下进行评估,通常在视频编码方法已知时使用。
当然,最传统的方法是计算两段视频信噪比(SNR)与峰值信噪比(PSNR)的差异。PSNR是使用最广泛的客观视频质量的度量方法,但由于人类视觉系统的非线性,因此PSNR值与人眼感受到的视频质量仍有较大出入。近来一些更复杂、更精确的一些指标被指定,比如VQM (页面存档备份,存于互联网档案馆)、PEVQ(英语:Perceptual Evaluation of Video Quality)、结构相似性(SSIM)、VQuad-HD(英语:VQuad-HD) (页面存档备份,存于互联网档案馆)、CZD(英语:Czenakowski distance)。
一个客观的视频质量指标的表现由计算客观分数与视频主观质量(英语:Subjective video quality)测试分数之间的相关性得出。后者被称为平均意见分数(MOS)。最常用的相关系数有:线性相关系数、斯皮尔曼等级相关系数、峰度、Kappa系数(英语:Cohen's kappa)与离群率(英语:Outliers ratio)。
客观模型可以根据原始信号、接收信号或是否存在信号的可用信息量进行分类:
用于视频质量评估的一些模型(如PSNR或SSIM)只是图像质量模型,其输出是为视频序列的每一帧计算的。然后可以记录每一帧的质量度量,并随着时间的推移汇集在一起,以评估整个视频序列的质量。虽然这种方法很容易实现,但它没有考虑到随时间发展的某些类型的降级,例如由数据包丢失及其隐藏引起的运动伪像。考虑质量下降的时间方面的视频质量模型,如VQM或电影指数,可能能够产生更准确的人类感知质量的预测。
VMAF使用四个特征来预测视频质量VIF、DLM、MCPD和信噪比。使用基于SVM的回归来融合上述特征,以提供单个输出分数。然后,使用算术平均在整个视频序列上暂时汇集这些分数,以提供总体差异平均意见分数(DMOS)。
当评估一个视频编解码器的质量时,所有上文提到的客观方法可能都要逐一反复进行测试,以满足所需的视觉质量水平。无疑,这十分费时、复杂,并且在商业化应用中不切实际。出于上述原因,许多研究都专注于开发新的客观评价方法,使其更为实用 。
许多主观视频质量的主要目标是自动评估用户(即观众)对视频处理系统处理后的视频质量的意见。其主要思路与MOS相近,即记录观众意见的平均值来评估视频的质量。但是测试出的细节出入可能极大。
HDR指标付费
MSU提出的指标: 模糊程度指标, 区块效应指标, 亮度抖动指标, 丢帧指标, 噪声估计指标