MPEG-2

✍ dations ◷ 2025-12-10 21:16:38 #影像科技,电脑术语,影像编解码器,音频编解码器,MPEG,影像压缩技术

MPEG-2是MPEG工作组于1994年发布的视频和音频压缩国际标准。MPEG-2通常用来为广播信号提供视频和音频编码,包括卫星电视、有线电视等。MPEG-2经过少量修改后,也成为DVD产品的核心技术。

MPEG-2的系统描述部分(第1部分)定义了传输流,它用来一套在非可靠介质上传输数字视频信号和音频信号的机制,主要用在广播电视领域。

MPEG-2的第二部分即视频部分和MPEG-1类似,但是它提供对隔行扫描视频显示模式的支持(隔行扫描广泛应用在广播电视领域)。MPEG-2视频并没有对低比特率(小于1Mbps)进行优化,在3Mbit/s及以上比特率情况下,MPEG-2明显优于MPEG-1。MPEG-2向后兼容,也即是说,所有符合标准的MPEG-2解码器也能够正常播放MPEG-1视频流。

MPEG-2技术也应用在了HDTV传输系统和蓝光光盘中。

MPEG-2的第三部分定义了音频压缩标准。该部分改进了MPEG-1的音频压缩,支持两通道以上的音频。MPEG-2音频压缩部分也保持了向后兼容的特点。

MPEG-2的第七部分定义了不能向后兼容的音频压缩。该部分提供了更强的音频功能。通常我们所说的MPEG-2AAC指的就是这一部分。

一个MPEG-2系统流一般包括两个基本元素:

MPEG-2图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。

MPEG-2视频通常包含多个GOP(Group Of Pictures),每一个GOP包含多个帧(frame)。帧的帧类(frame type)通常包括I-帧(I-frame)、P-帧(P-frame)和B-帧(B-frame)。其中I-帧采用帧内编码,P-帧采用前向估计,B-帧采用双向估计。

I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。I帧使用帧内压缩,不使用运动补偿,由于I帧不依赖其它帧,所以是随机存取的入点,同时是解码的基准帧。I帧主要用于接收机的初始化和信道的获取,以及节目的切换和插入,I帧图像的压缩倍数相对较低。I帧图像是周期性出现在图像序列中的,出现频率可由编码器选择。

P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。

B帧图像采用双向时间预测,可以大大提高压缩倍数。值得注意的是,由于B帧图像采用了未来帧作为参考,因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。

MPEG-2的编码码流分为六个层次。为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。它分为六层,从上至下依次为:视频序列层(Sequence),图像组层(GOP: Group of Picture),图像层(Picture),像条层(Slice),宏块层(Macro Block)和像块层(Block)。可以看到,除宏块层和像块层外,上面四层中都有相应的起始码(Start Code,SC),可用于因误码或其它原因收发两端失步时,解码器重新捕捉同步。因此一次失步将至少丢失一个像条的数据。

一般来说输入视频格式是25(CCIR标准)或者29.97(FCC)帧/秒。

MPEG-2支持隔行扫描和逐行扫描。在逐行扫描模式下,编码的基本单元是帧。在隔行扫描模式下,基本编码可以是帧,也可以是场(field)。

原始输入图像首先被转换到YCbCr色彩空间。其中Y是亮度,Cb和Cr是两个色度通道。对于每一通道,首先采用块分割,然后形成“宏块”(macroblocks),宏块构成了编码的基本单元。每一个宏块再分割成8x8的小块。色度通道分割成小块的数目取决于初始参数设置。例如,在常用的4:2:0格式下,每个色度宏块只采样出一个小块,所以三个通道宏块能够分割成的小块数目是4+1+1=6个。

对于I-帧,整幅图像直接进入编码过程。对于P-帧和B-帧,首先做运动补偿。通常来说,由于相邻帧之间的相关性很强,宏块可以在前帧和后帧中对应相近的位置找到相似的区域匹配的比较好,这个偏移量作为运动向量被记录下来,运动估计重构的区域的误差被送到编码器中编码。

对于每一个8×8小块,离散余弦变换把图像从空间域转换到频域。得到的变换系数被量化并重新组织排列顺序,从而增加长零的可能性。之后做游程编码(run-length code)。最后作哈夫曼编码(Huffman Encoding)。

I帧编码是为了减少空间域冗余,P帧和B帧是为了减少时间域冗余。

GOP是由固定模式的一系列I帧、P帧、B帧组成。常用的结构由15个帧组成,具有以下形式IBBPBBPBBPBBPBB。GOP中各个帧的比例的选取和带宽、图像的质量要求有一定关系。例如因为B帧的压缩时间可能是I帧的三倍,所以对于计算能力不强的某些实时系统,可能需要减少B帧的比例。

MPEG-2输出的比特流可以是匀速或者变速的。最大比特率,例如在DVD应用上,可达10.4 Mbit/s。如果要使用固定比特率,量化尺度就需要不断的调节以产生匀速的比特流。但是,提高量化尺度可能带来可视的有损效果。比如马赛克现象。

MPEG-2的音频编码包括:

DVD中采用了MPEG-2标准并引入如下技术参数限制:

DVB-MPEG相关技术参数:

注:1080i按1920×1080像素编码,但是最后8行在显示时抛弃。

相关

  • 语言习得语言习得(英语: language acquisition,又译“语言悉得”〔因为此概念与学习无关〕)是人类语言发展的进程,也是典型的人类特有的特征之一,因为非人类的生物不使用语言交流。第一
  • 骑士精神骑士精神,是中世纪欧洲上层社会的一种精神文明,它是以个人身份的优越感为基础的道德与人格的表现,但它也积淀着西欧民族远古尚武精神的某些积极因素,继承了古代欧洲部落文明至早
  • 南斗星君南斗星君,与北斗星君并称,是道教中重要的星君,掌管南斗六星。分别是:‘司命星、司禄星、延寿星、益算星、度厄星、上生星’。据说,南斗星掌理人类的寿命长短,俗说:“南斗注生,北斗注
  • 自发衰变自发裂变(英语:Spontaneous fission)是一种放射性衰变,只发生于原子量高的化学元素。由于元素的核结合能在原子量约为58个原子质量单位(u)时最高,因此更高质量的原子核会自发性分解
  • 红皇后假说红皇后假说 (英语:Red Queen hypothesis),一种关于生物协同进化的假说,由演化生物学家Leigh Van Valen(英语:Leigh Van Valen)于1973年提出。其中心为物种间为了抢夺资源,必须不停歇
  • 邻家特工《邻家特工》(英语:The Spy Next Door)是2010年初上映一部动作喜剧片,由布莱恩·莱温特执导,成龙、琥珀·瓦莱塔、比利·雷·赛勒斯领衔主演。在影片开始,播放了一段用蒙太奇的手
  • Stat.美国法律总汇(英语:United States Statutes at Large),是通过编年体的方式,由美国国家档案总署自1937年开始编辑的官方法律汇编。总汇中有所有美国建国以来通过的法律,至今已经有1
  • 谱系图谱系图或称系谱图、族谱图、世系图、家系图、家族树,是一种描绘家庭关系的树状结构图,每个树中的成员可以找到与其他相关树中的同一个人联接起来,共同构成一个巨大的网络家谱。
  • 孔肠科孔肠科(学名: Opecoelidae)是斜睾目之下一个吸虫纲复殖亚纲寄生虫的科,是复殖亚纲之下物种最丰盛的一个科,包含有近100个属、接近900个物种。这上千种物种全在淡水和咸水生活的真
  • 第一次接触 (科幻)第一次接触(First Contact)在科幻作品中是指人类和外星生物初次接触,或是遇到其他有高智能种族的情况。题材时常运用在人类学的第一次接触的情况,例如仇外、超验主义和自然语言