马尔可夫链

✍ dations ◷ 2025-05-17 11:33:56 #马尔可夫链

马尔可夫链(英语:Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain,缩写为DTMC),因俄国数学家安德烈·马尔可夫得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马尔可夫性质。马尔科夫链作为实际过程的统计模型具有许多应用。

在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。

马尔可夫链是离散状态、离散时间的马尔可夫过程。

马尔可夫链是满足马尔可夫性质的随机变量序列1, 2, 3, ...,即给出当前状态,将来状态和过去状态是相互独立的。从形式上看,

的可能值构成的可数集叫做该链的“状态空间”。

通常用一系列有向图来描述马尔可夫链,其中图的边用从时刻的状态到时刻的状态的概率 Pr ( X n + 1 = x X n = x n ) {displaystyle Pr(X_{n+1}=xmid X_{n}=x_{n})} 到时刻的转移矩阵表示同样的信息。但是,马氏链常常被假定为时齐的(见下文的变种),在这种情况下,图和矩阵与无关,因此也不表现为序列。

这些描述强调了马尔可夫链与初始分布 Pr ( X 1 = x 1 ) {displaystyle Pr(X_{1}=x_{1})} 到的概率非零,但到位于图的不同连通分量,那么 Pr ( X n + 1 = b | X n = a ) {displaystyle Pr(X_{n+1}=b|X_{n}=a)} 步从状态到状态的概率为

而单步转移是

对于一个时齐马尔可夫链来说:

步转移概率满足查普曼-科尔莫戈罗夫等式,对任意使得0 <  < ,

其中为此马尔可夫链的状态空间。

边缘分布Pr( = )为第次状态的分布。初始分布为Pr(0 = )。用一步转移把过程演变描述为

注意:上标()是索引而非指数。

马尔可夫链是由一个条件分布来表示的

这被称为是随机过程中的“转移概率”。这有时也被称作是“一步转移概率”。二、三,以及更多步的转移概率可以导自一步转移概率和马尔可夫性质:

同样,

这些式子可以通过乘以转移概率并求 k 1 {displaystyle k-1} 求和:

所以,对于可反转马尔可夫链,总是一个平稳分布。

伯努利方案是马尔可夫链的一种特殊情形,其转移概率矩阵有相同的行,即下一状态均匀独立于当前状态(除了独立于过往状态以外)。 仅有两个可能状态的伯努利方案是伯努利过程。

对于一般状态空间上的马尔可夫链的概述,详见文章状态空间可测的马尔可夫链。

马尔可夫系统广泛出现在热力学和统计力学中,

隐马尔科夫模型是大多数现代自动语音识别系统的基础。

谷歌所使用的网页排序算法(PageRank)就是由马尔可夫链定义的。如果 N {displaystyle N} 是已知的网页数量,一个页面 i {displaystyle i} k i {displaystyle k_{i}} 个链接到这个页面,那么它到链接页面的转换概率为 α k i + 1 α N {displaystyle {frac {alpha }{k_{i}}}+{frac {1-alpha }{N}}} ,到未链接页面的概率为 1 α N {displaystyle {frac {1-alpha }{N}}} , 参数 α {displaystyle alpha } 的取值大约为0.85。

马尔可夫模型也被应用于分析用户浏览网页的行为。一阶或者二阶的马尔可夫模型可以用于对一个用户从某一网络链接转移到另一链接的行为进行建模,然后这些模型可以用于对用户之后的浏览行为进行预测。

马尔科夫链可以应用于金融与经济中一系列现象的建模,包括资产价值与市场冲击。1974年Prasad等人第一次应用马尔科夫链于金融模型,另一个是James D. Hamilton 1989年应用的机制转换模型,其中马尔科夫链用来对高GDP增长速度时期与低GDP增长速度时期(换言之,经济扩张与紧缩)的转换进行建模。

马尔可夫链也有众多的生物学应用,特别是增殖过程,可以帮助模拟生物增殖过程的建模。隐蔽马尔可夫模型还被用于生物信息学,用以编码区域或基因预测(见哈代-温伯格定律。)

马尔可夫过程,能为给定样品文本,生成粗略,但看似真实的文本:他们被用于众多供消遣的“模仿生成器”软件。马尔可夫链还被用于谱曲。

用于计算马尔可夫信源的极限熵

马尔可夫在1906年首先做出了这类过程。而将此一般化到可数无限状态空间是由俄国数学家柯尔莫果洛夫(俄语:Андре́й Никола́евич Колмого́ров)在1936年给出的。马尔可夫链与布朗运动以及遍历假说这两个二十世纪初期物理学重要课题是相联系的,但马尔可夫寻求的似乎不仅于数学动机,名义上是对于纵属事件大数法则的扩张。

相关

  • 英国人英国人(British people)是指持有英国国籍的人或英国公民。 不列颠人(Britons)最初是指原居于不列颠群岛的凯尔特人,后为盎格鲁撒克逊人所使用而转为大不列颠岛上的盎格鲁撒克逊人
  • 活在当下活在当下(常译作及时行乐)为拉丁语格言“Carpe diem”(把握今朝),语出自贺拉斯的拉丁语诗集《颂歌》。完整诗文为“carpe diem, quam minimum credula postero”。可翻译为“活在
  • 国际化学品安全规划署国际化学品安全规划署(英语:International Programme on Chemical Safety,简称IPCS)成立于1980年,是世界卫生组织、国际劳工组织和联合国环境署这三个联合国组织相互协作成立的机
  • 罗湿陀罗拘陀罗湿陀罗拘陀王朝(梵语:राष्ट्रकूट;英语:Rashtrakuta dynasty)8世纪~10世纪时存在于印度中部与南部的一个重要王国。罗湿陀罗拘陀人的起源不详。有人认为他们是拉其普
  • 德沃加尔德沃加尔(Devgarh),是印度拉贾斯坦邦Rajsamand县的一个城镇。总人口16500(2001年)。该地2001年总人口16500人,其中男性8428人,女性8072人;0—6岁人口2672人,其中男1433人,女1239人;识字
  • 千田健太千田健太(1985年8月2日-)是一名日本击剑运动员,毕业于中央大学。他在2012年夏季奥林匹克运动会中,参加了男子团体花剑比赛并获得银牌。他的父亲也是一名击剑选手。
  • 图书馆学与资讯科学大辞典“图书馆学与资讯科学大辞典”由胡述兆主编,原全书三册,于民国八十四年由汉美公司出版。内容包含图书馆学、资讯科学、目录学及档案学。凡与这些学门有关的理论、实务、历史、
  • 仙佛同源《仙佛同源》, 元代全真道士“缘督真人”赵友钦著。专论道、佛一致。其徒“上阳子”陈致虚《金丹大要》中有少量遗说。《金丹大要序》:“缘督子词气聪明,博物精通,挹尽群书,或注
  • 蜀山站蜀山站位于余姚市凤山街道境内,是萧甬铁路上一个三等货运站。车站随沪杭甬铁路(曹甬段)始建于1913年,后由于土质原因倒塌,重建于1920年。抗日战争时,车站遭到废弃,目前车站为1955年
  • 斯里兰卡总理列表立法司法 政治主题斯里兰卡是南亚岛国,1948年前属英国殖民地,1948年宣告独立为锡兰自治领,但身为政府首脑的锡兰总理一职早在1947年就已经设立。1972年,锡兰自治领更名“自由、主权和独立的斯里兰卡共和国”,职位遂更名为斯里兰卡总理至今。总理同时兼任外事和国防部长,直至1977年朱尼厄斯·理查德·贾亚瓦尔德纳政府另行组建国防部和外交部止。1978年,贾亚瓦尔德纳总理通过宪法修正条款设立斯里兰卡总统一职,减少总理职权:总统成为国家元首兼政府首脑,总理变得有名无实。根据现行《斯里兰卡宪法》,总理是内阁首