前向算法

✍ dations ◷ 2025-05-18 00:36:16 #自March 2015需要进一步厘清的条目,马尔可夫模型

前向算法(Forward algorithm),在隐马尔可夫模型(HMM)中,是用于计算“置信状态”的。置信状态指根据既往证据推算出的当前状态的概率分布。这个过程也被叫做“滤波”。前向算法和维特比算法紧密相关但又互不相同。

前向算法是用来解决解码问题的算法之一。自从语音识别技术和模式识别技术发展以来,它也越来越普遍地被用在像计算生物学这样的使用HMM的领域内。

整个算法的目标是计算联合概率分布 p ( x t , y 1 : t ) {\displaystyle p(x_{t},y_{1:t})} 。为了方便,我们把 x ( t ) {\displaystyle x(t)} 简写做 x t {\displaystyle x_{t}} ,将 ( y ( 1 ) , y ( 2 ) , . . . , y ( t ) ) {\displaystyle (y(1),y(2),...,y(t))} 简写做 y 1 : t {\displaystyle y_{1:t}} 。直接计算 p ( x t , y 1 : t ) {\displaystyle p(x_{t},y_{1:t})} 则需要计算所有状态序列 { x 1 : t 1 } {\displaystyle \{x_{1:t-1}\}} 的边缘分布,而它的数量和 t {\displaystyle t} 成指数相关。使用这一算法,我们可以利用HMM的条件独立性质,递归地进行计算。

我们令

利用链式法则来展开 p ( x t , x t 1 , y 1 : t ) {\displaystyle p(x_{t},x_{t-1},y_{1:t})} ,我们可以得到

由于 y t {\displaystyle y_{t}} 和除了 x t {\displaystyle x_{t}} 之外的一切都条件独立,而 x t {\displaystyle x_{t}} 又和 x t 1 {\displaystyle x_{t-1}} 之外的一切都条件独立,因此

这样,由于 p ( y t | x t ) {\displaystyle p(y_{t}|x_{t})} p ( x t | x t 1 ) {\displaystyle p(x_{t}|x_{t-1})} 由HMM的输出概率和状态转移概率我们可以很快计算用 α t 1 ( x t 1 ) {\displaystyle \alpha _{t-1}(x_{t-1})} 计算出 α t ( x t ) {\displaystyle \alpha _{t}(x_{t})} ,并且可以避免递归计算。

前向算法可以很容易地被修改来适应其他的HMM变种,比如马尔可夫跳跃线性系统。

为了能够使用“未来的历史”(比如我们在试图预测过去的某个时点的状态),我们可以运行后向算法,它是前向算法的一个补充。这一操作被称为平滑。 前向-后向算法对 1 < k < t {\displaystyle 1<k<t} 计算 P ( x k | y 1 : t ) {\displaystyle P(x_{k}|y_{1:t})} ,因此使用了过去和未来的全部信息。

为了解码最可能的序列,需要使用维特比算法。它会从过去的观测中试图推测最可能的状态序列,也即使 P ( x 0 : t | y 0 : t ) {\displaystyle P(x_{0:t}|y_{0:t})} 最大化的状态序列。

相关

  • 自然医学自然医学(英语:Naturopathy,或Naturopathic Medicine),又称自然疗法,起源于19世纪欧洲的非主流医疗方式,通常被归类在替代医学中。自然医学把人体视为一个整体,相信人体存在生命力,有
  • 赫伯特·史宾赛赫伯特·斯宾塞(英语:Herbert Spencer,1820年4月27日-1903年12月8日),英国哲学家、社会达尔文主义之父,他提出将“适者生存”应用在社会学,尤其是教育及阶级斗争。但是,他的著作对很
  • 依赖保育 (CD)依赖保育物种又称依保物种,是IUCN中保护现状属于Conservation Dependent(cd)的一类物种。保护现状比较低,但依赖于人类保育,以防止其濒危或灭绝。观测此物种必须聚焦于一个持续的
  • 韦纳奇韦纳奇国家森林(英语:Wenatchee National Forest)是位于华盛顿州的美国国家森林。其面积1,735,394英亩(7,022.89平方千米),沿着喀斯喀特山脉东坡绵延,从奥卡纳干国家森林延续到吉福
  • 大德科学园区大德科学园区(韩语:대덕연구개발특구 / 大德硏究開發特區)是一座位于大韩民国大田广域市儒城区的科学园区。大德科学园区成立于1974年,是韩国最大的科学园,被称为“韩国科技的摇
  • 泰始泰始是几个中国历史上年号的名称:
  • 普吉岛普吉府(泰语:จังหวัดภูเก็ต,皇家转写:Changwat Phuket,泰语发音:)是泰国77个一级行政区之一,府治为与行政区同名的普吉市。该行政区全境以普吉岛再加上32个离岛为范围
  • 家训钱氏家训是指吴越钱氏家族的家训,最初包括钱氏家族始祖、吴越国创始人钱镠的《武肃王八训》与《武肃王遗训》。目前流传的《钱氏家训》则是钱镠三十二世孙钱文选根据先祖的八
  • 威廉·戈德温威廉·戈德温(William Godwin,1756年3月3日-1836年4月7日),英国记者、哲学家、小说家。被认为是效益主义的最早解释者之一和无政府主义的提出者之一。 以其同一年内(1793年)发表的
  • 李硕珉李硕珉(朝鲜语:이석민 ,1997年2月18日-),以艺名DK(朝鲜语:도겸 ,日语:ドギョム )为人熟识,韩国男艺人。韩国Pledis娱乐男子组合SEVENTEEN、分队Vocal Team成员之一,另外是分队夫硕顺的