隐马尔可夫模型

✍ dations ◷ 2025-06-18 05:22:21 #隐马尔可夫模型

隐马尔可夫模型(Hidden Markov Model;缩写:HMM)或称作隐性马尔可夫模型,是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。

在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。

下边的图示强调了HMM的状态变迁。有时,明确的表示出模型的演化也是有用的,我们用 (1) 与 (2) 来表达不同时刻 12 的状态。

图中箭头方向则表示不同信息间的关系性,因此可以得知 x ( t ) {displaystyle x(t)} (), ())都可以向前或向后延伸。通常,时间的起点被设置为=0 或 =1.

假设观察到的结果为 Y {displaystyle Y}

Y = y ( 0 ) , y ( 1 ) , . . . , y ( L 1 ) {displaystyle Y=y(0),y(1),...,y(L-1)}

隐藏条件为 X {displaystyle X}

X = x ( 0 ) , x ( 1 ) , . . . , x ( L 1 ) {displaystyle X=x(0),x(1),...,x(L-1)}

长度为 L {displaystyle L} ,则马尔可夫模型的概率可以表达为:

P ( Y ) = X P ( Y X ) P ( X ) {displaystyle P(Y)=sum _{X}P(Ymid X)P(X),}

由这个概率模型来看,可以得知马尔可夫模型将该时间点前后的信息都纳入考量。

HMM有三个典型(canonical)问题:

此外,已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Welch算法以及Viterbi algorithm(英语:Viterbi algorithm)解决。另外,最近的一些方法使用联结树算法(英语:Junction tree algorithm)来解决这三个问题。

假设你有一个住得很远的朋友,他每天跟你打电话告诉你他那天做了什么。你的朋友仅仅对三种活动感兴趣:公园散步,购物以及清理房间。他选择做什么事情只凭天气。你对于他所住的地方的天气情况并不了解,但是你知道总的趋势。在他告诉你每天所做的事情基础上,你想要猜测他所在地的天气情况。

你认为天气的运行就像一个马尔可夫链。其有两个状态“雨”和“晴”,但是你无法直接观察它们,也就是说,它们对于你是隐藏的。每天,你的朋友有一定的概率进行下列活动:“散步”、“购物”、“清理”。因为你朋友告诉你他的活动,所以这些活动就是你的观察数据。这整个系统就是一个隐马尔可夫模型(HMM)。

你知道这个地区的总的天气趋势,并且平时知道你朋友会做的事情。也就是说这个隐马尔可夫模型的参数是已知的。你可以用程序语言(Python)写下来:

 states = ('Rainy', 'Sunny')  observations = ('walk', 'shop', 'clean')  start_probability = {'Rainy': 0.6, 'Sunny': 0.4}  transition_probability = {    'Rainy' : {'Rainy': 0.7, 'Sunny': 0.3},    'Sunny' : {'Rainy': 0.4, 'Sunny': 0.6},    }  emission_probability = {    'Rainy' : {'walk': 0.1, 'shop': 0.4, 'clean': 0.5},    'Sunny' : {'walk': 0.6, 'shop': 0.3, 'clean': 0.1},    }

在这些代码中,start_probability代表了你对于你朋友第一次给你打电话时的天气情况的不确定性(你知道的只是那个地方平均起来下雨多些)。在这里,这个特定的概率分布并非平衡的,平衡概率应该接近(在给定变迁概率的情况下){'Rainy': 0.571, 'Sunny': 0.429}transition_probability 表示基于马尔可夫链模型的天气变迁,在这个例子中,如果今天下雨,那么明天天晴的概率只有30%。代码emission_probability 表示了你朋友每天做某件事的概率。如果下雨,有50% 的概率他在清理房间;如果天晴,则有60%的概率他在外头散步。

这个例子在维特比算法页上有更多的解释。

因为马尔可夫模型有下列特色:

隐马尔可夫模型最初是在20世纪60年代后半期Leonard E. Baum和其它一些作者在一系列的统计学论文中描述的。HMM最初的应用之一是开始于20世纪70年代中期的语音识别。

在1980年代后半期,HMM开始应用到生物序列尤其是DNA的分析中。此后,在生物信息学领域HMM逐渐成为一项不可或缺的技术。

相关

  • 小蓝蟹小蓝蟹(学名Callinectes similis)是一种美青蟹属物种。小蓝蟹最后的步足扁平,适合游泳。公蟹可以阔达12.2厘米,雌蟹则阔9.5厘米。小蓝蟹的最为接近Callinectes danae及Callinect
  • 熊会贞熊会贞(?-1936年5月25日),中国地理学家,杨守敬弟子。熊会贞一直协助杨守敬完成《水经注疏》的工作,熊会贞在《〈水经注疏〉修改意见》中所说的“文,先生三分之二,会贞三分之一”。杨
  • 仄起式仄起式是一种诗的格式。一般来说,仄起式的诗在第一行第二字为仄声字,而律诗即以第一行第二字决定平起或仄起。对于格式就有不同的规定。
  • 郭则寿《卧虎阁诗》 郭则寿(1883年-1943年),原名则恒,字孝孜,号舜卿,道号性彬。福建省侯官县人,比利时大学毕业,法政科进士。《卧虎阁诗集》
  • 董辅礽董辅礽(1927年-2004年),男,浙江宁波人,中国经济学家,有“一代经济学大师”之称,其生前为中国大陆经济体制改革作出了巨大贡献。董辅礽先生于1927年生于浙江省宁波市。1946年入武汉大
  • 卢埃里·罗宾森卢埃里·罗宾森,爱尔兰电影导演、编剧。他主要以他的科幻短片和动画而闻名,其中,《一半儿灰色》被提名奥斯卡金像奖,也被包含在Animation Show of Shows中。短片《沉默之城》讲
  • 柯尔奖柯尔奖(Cole Prize ,全名:Frank Nelson Cole Prize),由美国数学学会授奖。分别有数论奖(1931年开始)和代数奖(1928年开始),奖励数论和代数领域的成果。它是为纪念为学会服务了25年的弗
  • 凯·卡农凯·卡农(英语:Kay Cannon,1985年8月9日-)是美国电影和电视编剧和演员,曾以美国情景喜剧《超级制作人》获得艾美奖提名的编剧和制片人的,及电影《歌喉赞》系列编剧工作。她也是美国电视剧《俏妞报到》的联合执行制片和编剧。
  • 朱宗宏朱宗宏(1960年代-),男,中国宇宙学家,曾任北京师范大学天文系系主任、教授,中国天文学会常务理事,现任武汉大学教授。
  • 吕瑟教堂吕瑟教堂(挪威语:Lyse kapell)是一座挪威教会的小型教堂,位于挪威罗加兰郡福桑市镇的Lysebotn村,在吕瑟峡湾的尽头。该堂属于斯塔万格教区的一部分。这座木结构教堂建于1961年,由建筑师Gustav Helland and Endre Årreberg设计。该堂可容纳150人,1961年5月28日由主教Fridtjov Birkeli献堂。由于该村仅有数十居民,该堂不常使用。2009年,市镇当局曾计划关闭并出售教堂,但因村民反对而作罢。