隐马尔可夫模型

✍ dations ◷ 2025-08-27 00:51:49 #隐马尔可夫模型

隐马尔可夫模型(Hidden Markov Model;缩写:HMM)或称作隐性马尔可夫模型,是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。

在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。

下边的图示强调了HMM的状态变迁。有时,明确的表示出模型的演化也是有用的,我们用 (1) 与 (2) 来表达不同时刻 12 的状态。

图中箭头方向则表示不同信息间的关系性,因此可以得知 x ( t ) {displaystyle x(t)} (), ())都可以向前或向后延伸。通常,时间的起点被设置为=0 或 =1.

假设观察到的结果为 Y {displaystyle Y}

Y = y ( 0 ) , y ( 1 ) , . . . , y ( L 1 ) {displaystyle Y=y(0),y(1),...,y(L-1)}

隐藏条件为 X {displaystyle X}

X = x ( 0 ) , x ( 1 ) , . . . , x ( L 1 ) {displaystyle X=x(0),x(1),...,x(L-1)}

长度为 L {displaystyle L} ,则马尔可夫模型的概率可以表达为:

P ( Y ) = X P ( Y X ) P ( X ) {displaystyle P(Y)=sum _{X}P(Ymid X)P(X),}

由这个概率模型来看,可以得知马尔可夫模型将该时间点前后的信息都纳入考量。

HMM有三个典型(canonical)问题:

此外,已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Welch算法以及Viterbi algorithm(英语:Viterbi algorithm)解决。另外,最近的一些方法使用联结树算法(英语:Junction tree algorithm)来解决这三个问题。

假设你有一个住得很远的朋友,他每天跟你打电话告诉你他那天做了什么。你的朋友仅仅对三种活动感兴趣:公园散步,购物以及清理房间。他选择做什么事情只凭天气。你对于他所住的地方的天气情况并不了解,但是你知道总的趋势。在他告诉你每天所做的事情基础上,你想要猜测他所在地的天气情况。

你认为天气的运行就像一个马尔可夫链。其有两个状态“雨”和“晴”,但是你无法直接观察它们,也就是说,它们对于你是隐藏的。每天,你的朋友有一定的概率进行下列活动:“散步”、“购物”、“清理”。因为你朋友告诉你他的活动,所以这些活动就是你的观察数据。这整个系统就是一个隐马尔可夫模型(HMM)。

你知道这个地区的总的天气趋势,并且平时知道你朋友会做的事情。也就是说这个隐马尔可夫模型的参数是已知的。你可以用程序语言(Python)写下来:

 states = ('Rainy', 'Sunny')  observations = ('walk', 'shop', 'clean')  start_probability = {'Rainy': 0.6, 'Sunny': 0.4}  transition_probability = {    'Rainy' : {'Rainy': 0.7, 'Sunny': 0.3},    'Sunny' : {'Rainy': 0.4, 'Sunny': 0.6},    }  emission_probability = {    'Rainy' : {'walk': 0.1, 'shop': 0.4, 'clean': 0.5},    'Sunny' : {'walk': 0.6, 'shop': 0.3, 'clean': 0.1},    }

在这些代码中,start_probability代表了你对于你朋友第一次给你打电话时的天气情况的不确定性(你知道的只是那个地方平均起来下雨多些)。在这里,这个特定的概率分布并非平衡的,平衡概率应该接近(在给定变迁概率的情况下){'Rainy': 0.571, 'Sunny': 0.429}transition_probability 表示基于马尔可夫链模型的天气变迁,在这个例子中,如果今天下雨,那么明天天晴的概率只有30%。代码emission_probability 表示了你朋友每天做某件事的概率。如果下雨,有50% 的概率他在清理房间;如果天晴,则有60%的概率他在外头散步。

这个例子在维特比算法页上有更多的解释。

因为马尔可夫模型有下列特色:

隐马尔可夫模型最初是在20世纪60年代后半期Leonard E. Baum和其它一些作者在一系列的统计学论文中描述的。HMM最初的应用之一是开始于20世纪70年代中期的语音识别。

在1980年代后半期,HMM开始应用到生物序列尤其是DNA的分析中。此后,在生物信息学领域HMM逐渐成为一项不可或缺的技术。

相关

  • 驻东部战区审计局中国人民解放军军徽中央军委审计署驻东部战区审计局,位于江苏省南京市,是中央军事委员会审计署下属局,负责中国人民解放军东部战区审计工作。在深化国防和军队改革中,2016年1月
  • 共模干扰共模干扰(common-mode interference)为电信术语,有以下二种不同的意思:例如一个5V电路,其信号端及接地同时出现了一个20V,宽度1nS的方波,这就属于共模干扰。共模干扰可以用以下的方
  • 马尔耶卡雷利博物馆马尔耶卡雷利博物馆 (俄语:Малые Корелы)是一个位于北俄罗斯阿尔汉格尔斯克州普里莫尔斯基区的村庄,主要景点是生态博物馆,有许多传统的木造建筑。马尔耶卡雷利博物馆
  • 白尾尖镰嘴蜂鸟白尾尖镰嘴蜂鸟(学名:)在生物分类学上是蜂鸟科隐蜂鸟亚科中的一个种。分布于哥斯达黎加、厄瓜多尔西部以及秘鲁东北部。身体全长14厘米。
  • 范充浊范充浊(?-?),一说万充浊,字清夫,顺天府霸州人,明朝政治人物。顺天府乡试第八十二名举人。嘉靖二十三年(1544年)中式甲辰科进士。升任甘肃兵备副使。曾祖范延寿,巡检;祖父范昭;父范魁,岁贡生
  • 尼古莱·库克先科夫尼古莱·尤利耶维奇·库克先科夫(俄语:Николай Юльевич Куксенков,乌克兰语:Микола Юлійович Куксенков,1989年6月2日-)是一名生于
  • 孙秀 (西晋)孙秀(3世纪-301年),字俊忠,祖籍琅琊(治所在今山东省临沂市)。是西晋时期的大臣,曾任中书令,后被攻杀于中书省。后来发动孙卢之乱的孙恩是其族人。孙氏家族世奉五斗米道。孙秀早年为琅琊小吏,狡黠自喜,潘岳痛恶其为人,数挞辱之。后孙秀成为司马伦亲信,晋升侍郎。赵王司马伦为镇西将军,挠乱关中,氐羌反叛。当时雍州刺史解系上表欲杀孙秀以谢氐羌,朝廷不许,只召回司马伦和孙秀,由梁王司马肜任镇西将军。孙秀在朝中玩弄权术,废皇后贾南风,飞扬跋扈,“所共立事者,皆邪佞之徒,惟竞荣利,无深谋远略”。他曾因羊献容的外祖父孙旗
  • 华绍林华绍林(1942年-),女,北京人,中国跳伞运动员,曾任国际航空联合会副主席,中国航空运动协会副主席。
  • 拜占庭亚美尼亚拜占庭亚美尼亚,有时也称作西亚美尼亚,是对亚美尼亚王国被并入拜占庭帝国部分的称呼。其范围大小随着时间而变化,取决于拜占庭对亚美尼亚的控制程度。拜占庭与萨珊帝国先后于387年和428年瓜分亚美尼亚,西亚美尼亚由拜占庭帝国统治,东亚美尼亚(英语:Persian Armenia)则落入萨珊王朝之手。即便是在亚美尼亚巴格拉提德王朝建立之后,亚美尼亚一些历史悠久的地区或亚美尼亚人居住的地区仍处于拜占庭统治之下。亚美尼亚人在451年的迦克墩公会议没有代表出席,因为他们正在武装反叛萨珊人。因此,亚美尼亚与拜占庭基督教在
  • 卡尔·卢格卡尔·卢格(德语:Karl Lueger,1844年10月24日-1910年3月10日),是奥匈帝国时期政治家、律师。卢格于1897年至1910年间一直担任维也纳市长,他在市长任内成功将维也纳建设为现代化城市。卢格创立了基督教社会党并提倡民粹主义和反犹太主义,因此他有时也被视为希特勒的纳粹主义的先驱。