动态预测

✍ dations ◷ 2025-07-16 04:21:22 #视讯,运动学

动态预测是一种透过运动矢量来描述一张2D图片是如何转换成另外一张2D图片的程序。在视频处理时,图片指的就是邻近的画格。这些运动矢量可以想成是3D空间(2D+时域)投影到2D的结果。对一张图片而言,可以给每一个像素创建一个独特的运动矢量,也可以将邻近的像素聚集成一个区块,并只计算每一个区块的运动矢量。运动矢量的数学模型可以是单纯的平移也可以含括例如3D空间的的转动和缩放等几何运动方式来更妥当地模拟真实摄影机的动态。

动态预测和光流法常常被互相混用。它同时也与图像配准和立体匹配有关。事实上上述几种词汇都是在找寻两张图片或视频画格间相对应的点。两图片或画格间相对应的点“通常”是该场景中的同一个点。然而,在作动态预测之前,我们必须定义相似性的比较标准。也就是说,我们需要一个尺度来测量两个点之间的相似程度。在相关领域的研究中,被定义了各种比较标准,像是SAD、MSE,随不同应用和优化需要常常会使用不同的比较标准。

用来找寻运动矢量的算法可以被分为基于像素值的“直接”算法和基于特征值的“间接”算法。两种方法都有其支持者,彼此曾在两篇论文中试图得到一个确切的结论。

则是透过一些特征,如角检测来对画格间做匹配,通常会透过一些数学式去对局部或全局的统计特性做估计,如此可以借由这些数学式来把不符合实际运动模式的匹配滤除掉。

常用的统计数学式例如RANSAC.

每一种上述的方法都可以被说成是需要一些自己定义的匹配标准。差异在于是要先对同一个区域总计地进行比较(如基于特征的算法),或者是针对每一个像素进行比较(如基于区块和滤波器的算法)。一种新兴的比较标准是将一个区域作局部的转换如拉普拉斯变换再将该区域各pixel作比较。有一些比较标准则可以将一些看起来相似但实际上并不匹配的点滤除,达到更好的匹配效果。

可以透过动态预测来做 动态补偿,利用视频在时域上的相似性对下一个时间点的画格做预测。动态预测和动态补偿都是视频压缩中相当关键的技术,普遍地被运用在各视频压缩的标准之中,例如MPEG及较近期的HEVC。

相关

  • 终身贵族终身贵族,亦作一代贵族,是英国贵族的一种。与一般贵族不同的是,终身贵族只限于个人,不能让其子女世袭继承。现时的终身贵族由1958年制定的《终身贵族法》所管制,爵位只限于男爵。
  • 抓氢键抓氢键(又称agostic键)是一种烷基、烯基、炔基或芳基中的氢与过渡金属间形成的3c2e键。
  • 硼酸盐硼酸盐是一类含硼的化合物。当中的硼可以与三个氧原子键合成B(OR)3,也可以与四个氧原子键合成B(OR)4-阴离子。硼酸根离子的化学式为BO3−3。它可与金属元素形成盐。在自然界
  • 书吏书吏又称作抄写员、文士,是古代一种专门为人纪录事情或抄写文本的职业。书吏的工作内容主要是抄写书籍,其内容可能是宗教文本、虚构故事、学术文本或教诲文学。有时候书吏还必
  • 外周神经病变周边神经病变(英语:Peripheral neuropathy,缩写PN)俗称神经系统疾病,是指神经系统的疾病或异常状态下的神经系统 。虽然在大众文化中神经病常常是一种代替精神病的说法,但神经病实
  • 崔圭夏崔圭夏(朝鲜语:최규하/崔圭夏 Choi Kyu-Hah,1919年7月16日-2006年10月22日),字瑞玉(서옥),号玄石(현석),韩国外交官及政治人物,曾为该国第12任总理、第10任总统。任职总统后随即在全斗焕
  • 蜂后蜂后又称蜂王、女王蜂,是蜜蜂群体中唯一能正常产卵的雌性蜂,蜂后通常是蜂群中其它成员的母亲,因此也称之为母蜂。一个蜜蜂群体中可能有几千到几万只蜜蜂,但只会有一只蜂后。蜂后
  • 浊齿龈边擦音浊齿龈边擦音(voiced alveolar lateral fricative、voiced dental and alveolar lateral fricatives)是辅音的一种,在国际音标中表示该音的符号是⟨ɮ⟩,X-SAMPA符号则是⟨K\⟩
  • 光学玻璃光学玻璃是制造光学镜头、光学仪器的主要材料。光学玻璃必须有高度精确的折射率、阿贝数和高透明度、高均匀度。最初用于制造镜头的玻璃,就是普通窗户玻璃或酒瓶上的疙瘩,形状
  • 打牲乌拉总管衙门打牲乌拉总管衙门,简称打牲乌拉(满语:ᠪᡠᡨᡥᠠ ᡠᠯᠠ,转写:),是清廷在今吉林境内设置的专门采集贡品的特殊机构,其辖区并与江宁织造、苏州织造、杭州织造同称为“清朝四大贡品基