动态预测

✍ dations ◷ 2025-12-06 20:44:15 #视讯,运动学

动态预测是一种透过运动矢量来描述一张2D图片是如何转换成另外一张2D图片的程序。在视频处理时,图片指的就是邻近的画格。这些运动矢量可以想成是3D空间(2D+时域)投影到2D的结果。对一张图片而言,可以给每一个像素创建一个独特的运动矢量,也可以将邻近的像素聚集成一个区块,并只计算每一个区块的运动矢量。运动矢量的数学模型可以是单纯的平移也可以含括例如3D空间的的转动和缩放等几何运动方式来更妥当地模拟真实摄影机的动态。

动态预测和光流法常常被互相混用。它同时也与图像配准和立体匹配有关。事实上上述几种词汇都是在找寻两张图片或视频画格间相对应的点。两图片或画格间相对应的点“通常”是该场景中的同一个点。然而,在作动态预测之前,我们必须定义相似性的比较标准。也就是说,我们需要一个尺度来测量两个点之间的相似程度。在相关领域的研究中,被定义了各种比较标准,像是SAD、MSE,随不同应用和优化需要常常会使用不同的比较标准。

用来找寻运动矢量的算法可以被分为基于像素值的“直接”算法和基于特征值的“间接”算法。两种方法都有其支持者,彼此曾在两篇论文中试图得到一个确切的结论。

则是透过一些特征,如角检测来对画格间做匹配,通常会透过一些数学式去对局部或全局的统计特性做估计,如此可以借由这些数学式来把不符合实际运动模式的匹配滤除掉。

常用的统计数学式例如RANSAC.

每一种上述的方法都可以被说成是需要一些自己定义的匹配标准。差异在于是要先对同一个区域总计地进行比较(如基于特征的算法),或者是针对每一个像素进行比较(如基于区块和滤波器的算法)。一种新兴的比较标准是将一个区域作局部的转换如拉普拉斯变换再将该区域各pixel作比较。有一些比较标准则可以将一些看起来相似但实际上并不匹配的点滤除,达到更好的匹配效果。

可以透过动态预测来做 动态补偿,利用视频在时域上的相似性对下一个时间点的画格做预测。动态预测和动态补偿都是视频压缩中相当关键的技术,普遍地被运用在各视频压缩的标准之中,例如MPEG及较近期的HEVC。

相关

  • 埃特纳火山埃特纳火山(意大利语:Etna),是欧洲著名的活火山,属层状火山。它位于意大利西西里岛东海岸的墨西拿和卡塔尼亚之间,是欧洲最高的活火山,海拔3326米,其高度随喷发活动而变化。埃特纳火
  • 五彩冠龙五彩冠龙(学名:Guanlong wucaii)是暴龙超科下的一种恐龙,属于原角鼻龙科,是其已知最早的暴龙类恐龙之一,生活于1亿6000万年前侏罗纪晚期牛津阶,比它著名的亲属暴龙要早9千2百万年。
  • 托斯登·威塞尔托斯坦·尼尔斯·威泽尔(瑞典语:Torsten Nils Wiesel,1924年6月3日-),瑞典神经科学家,与大卫·休伯尔(David H. Hubel)由于对视觉系统的讯息处理过程之研究,而和研究左右脑半球的罗杰
  • 燕巢系统燕巢系统交流道位于台湾高雄市燕巢区与旗山区交界,用于连结国道三号与国道十号,指标分别为383公里、19公里。燕巢系统交流道由于是国道三号与高雄市区重要的交通要道之一,且距
  • 菱形二十面体在几何学中,菱形二十面体是一种凸多面体,属于环带多面体,并且是异相双五角帐塔的对偶多面体。菱形二十面体由二十个菱形组成,其中包含了三种顶点,分别为周围有三个面、周围有四个
  • 灌木公园灌木公园(Bushy Park)是英国伦敦的第二大皇家园林,面积445公顷(1,100英亩),,灌木公园位于伦敦西南的泰晤士河畔里士满区,紧邻汉普敦宫和汉普敦宫公园北侧。大部分向公众开放。它的四
  • 天主教打拉教区天主教打拉教区 (拉丁语:Dioecesis Tarlacensis、他加禄语:Diyosesis ng Tarlac)是菲律宾一个罗马天主教教区,属天主教圣费尔南多总教区。辖区包括打拉省。2006年有教友976,000人
  • 佩勒姆 (阿拉巴马州)佩勒姆(英文:Pelham),是美国阿拉巴马州下属的一座城市。面积约为39.02平方英里(约合 101.07平方公里)。根据2010年美国人口普查,该市有人口21,352人,人口密度为547.16/平方英里(约合2
  • 真壁氏干真壁氏干(1550年9月12日-1622年4月17日)是日本战国时代至江户时代武将。佐竹氏家臣。常陆国真壁城城主。本姓平氏。官职是安艺守。弟弟为义干。自称暗夜轩。在天文19年(1550年)出
  • 古巴人权古巴人权一直是古巴政府和西方争论的问题之一。西方国家认为古巴人权状况恶劣,比如,政府镇压异议人士,限制国民出境旅行。但是古巴政府和古巴共产党对此不予承认并坚决反对。古