马尔可夫链

✍ dations ◷ 2025-11-21 09:39:21 #马尔可夫链

马尔可夫链(英语:Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain,缩写为DTMC),因俄国数学家安德烈·马尔可夫得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马尔可夫性质。马尔科夫链作为实际过程的统计模型具有许多应用。

在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。

马尔可夫链是离散状态、离散时间的马尔可夫过程。

马尔可夫链是满足马尔可夫性质的随机变量序列1, 2, 3, ...,即给出当前状态,将来状态和过去状态是相互独立的。从形式上看,

的可能值构成的可数集叫做该链的“状态空间”。

通常用一系列有向图来描述马尔可夫链,其中图的边用从时刻的状态到时刻的状态的概率 Pr ( X n + 1 = x X n = x n ) {displaystyle Pr(X_{n+1}=xmid X_{n}=x_{n})} 到时刻的转移矩阵表示同样的信息。但是,马氏链常常被假定为时齐的(见下文的变种),在这种情况下,图和矩阵与无关,因此也不表现为序列。

这些描述强调了马尔可夫链与初始分布 Pr ( X 1 = x 1 ) {displaystyle Pr(X_{1}=x_{1})} 到的概率非零,但到位于图的不同连通分量,那么 Pr ( X n + 1 = b | X n = a ) {displaystyle Pr(X_{n+1}=b|X_{n}=a)} 步从状态到状态的概率为

而单步转移是

对于一个时齐马尔可夫链来说:

步转移概率满足查普曼-科尔莫戈罗夫等式,对任意使得0 <  < ,

其中为此马尔可夫链的状态空间。

边缘分布Pr( = )为第次状态的分布。初始分布为Pr(0 = )。用一步转移把过程演变描述为

注意:上标()是索引而非指数。

马尔可夫链是由一个条件分布来表示的

这被称为是随机过程中的“转移概率”。这有时也被称作是“一步转移概率”。二、三,以及更多步的转移概率可以导自一步转移概率和马尔可夫性质:

同样,

这些式子可以通过乘以转移概率并求 k 1 {displaystyle k-1} 求和:

所以,对于可反转马尔可夫链,总是一个平稳分布。

伯努利方案是马尔可夫链的一种特殊情形,其转移概率矩阵有相同的行,即下一状态均匀独立于当前状态(除了独立于过往状态以外)。 仅有两个可能状态的伯努利方案是伯努利过程。

对于一般状态空间上的马尔可夫链的概述,详见文章状态空间可测的马尔可夫链。

马尔可夫系统广泛出现在热力学和统计力学中,

隐马尔科夫模型是大多数现代自动语音识别系统的基础。

谷歌所使用的网页排序算法(PageRank)就是由马尔可夫链定义的。如果 N {displaystyle N} 是已知的网页数量,一个页面 i {displaystyle i} k i {displaystyle k_{i}} 个链接到这个页面,那么它到链接页面的转换概率为 α k i + 1 α N {displaystyle {frac {alpha }{k_{i}}}+{frac {1-alpha }{N}}} ,到未链接页面的概率为 1 α N {displaystyle {frac {1-alpha }{N}}} , 参数 α {displaystyle alpha } 的取值大约为0.85。

马尔可夫模型也被应用于分析用户浏览网页的行为。一阶或者二阶的马尔可夫模型可以用于对一个用户从某一网络链接转移到另一链接的行为进行建模,然后这些模型可以用于对用户之后的浏览行为进行预测。

马尔科夫链可以应用于金融与经济中一系列现象的建模,包括资产价值与市场冲击。1974年Prasad等人第一次应用马尔科夫链于金融模型,另一个是James D. Hamilton 1989年应用的机制转换模型,其中马尔科夫链用来对高GDP增长速度时期与低GDP增长速度时期(换言之,经济扩张与紧缩)的转换进行建模。

马尔可夫链也有众多的生物学应用,特别是增殖过程,可以帮助模拟生物增殖过程的建模。隐蔽马尔可夫模型还被用于生物信息学,用以编码区域或基因预测(见哈代-温伯格定律。)

马尔可夫过程,能为给定样品文本,生成粗略,但看似真实的文本:他们被用于众多供消遣的“模仿生成器”软件。马尔可夫链还被用于谱曲。

用于计算马尔可夫信源的极限熵

马尔可夫在1906年首先做出了这类过程。而将此一般化到可数无限状态空间是由俄国数学家柯尔莫果洛夫(俄语:Андре́й Никола́евич Колмого́ров)在1936年给出的。马尔可夫链与布朗运动以及遍历假说这两个二十世纪初期物理学重要课题是相联系的,但马尔可夫寻求的似乎不仅于数学动机,名义上是对于纵属事件大数法则的扩张。

相关

  • 兔热病兔热病(拉丁语:Tularemia),又称野兔病(rabbit fever)、鹿蝇热(deer fly fever)、大原病(Ohara's fever)、法兰西斯氏病,一种因为细菌感染引起的人畜共通传染病。病原为土伦病法兰西斯氏
  • 操纵组操纵组(英语:operon,又称操纵子或操纵元)是一组关键的核苷酸序列,包括了一个操纵基因(operator),及一个或以上的结构基因被用作生产信使RNA(mRNA)的基元,受一个单一的启动子控制之下。
  • 细胞内钙传感蛋白细胞内钙传感蛋白(英语:Intracellular calcium-sensing proteins)是一类作用于第二信使系统的蛋白质。例子包括:酪氨酸:ZAP70 · 局部粘着蛋白酪氨酸激酶(PTK2, PTK2B) · BTK
  • 约翰·列侬约翰·温斯顿·小野·蓝侬,MBE(英语:John Winston Ono Lennon,出生名为John Winston Lennon;1940年10月9日-1980年12月8日)是一位英国歌手和词曲作者,身为披头士乐队的创始成员闻名
  • 四冲程循环四冲程循环(Four-stroke cycle),现在汽车以及工业用途的(汽车、卡车、发电机)内燃机中大多都是四冲程循环的。此技术由德国科学家尼古拉斯·奥托(Nicolaus Otto)于1876年发明,所以又
  • 愤怒的伦理学《愤怒的伦理学》(韩语:분노의 윤리학,英语:),是一部2013年上映的韩国电影。为新锐导演朴明朗首次执导的剧情长片,以一名女研究生的死亡为中心,让五个各怀鬼胎的男女流露出自私冷酷
  • 达梅罗湖坐标:53°33′52″N 12°12′23″E / 53.56444°N 12.20639°E / 53.56444; 12.20639达梅罗湖(德语:Damerower See),是德国的湖泊,位于该国东北部,由梅克伦堡-前波美拉尼亚州负责管
  • KBS晋州放送局KBS晋州放送局(朝鲜语:KBS진주방송국,朝鲜汉字:KBS晋州放送局;英语:KBS Jinju Broadcasting Station)位于大韩民国庆尚南道晋州市的韩国放送公社(KBS)的放送局。注:2012年10月4日14:00
  • 罗阿坦岛罗阿坦岛(英语:Roatán)为洪都拉斯北部海湾群岛中的一座岛屿,为海湾群岛中最大的岛屿。岛形成长条形,东西长约60公里,南北最宽处不足8公里。旧时曾为加勒比海地区海盗的活动基地,现
  • 洪德芳洪德芳(1975年3月25日-),台湾的退休棒球选手,曾经效力于中华职棒兄弟象队,守备位置为三垒手。