马尔可夫链

✍ dations ◷ 2025-04-02 19:02:08 #马尔可夫链

马尔可夫链(英语:Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain,缩写为DTMC),因俄国数学家安德烈·马尔可夫得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马尔可夫性质。马尔科夫链作为实际过程的统计模型具有许多应用。

在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。

马尔可夫链是离散状态、离散时间的马尔可夫过程。

马尔可夫链是满足马尔可夫性质的随机变量序列1, 2, 3, ...,即给出当前状态,将来状态和过去状态是相互独立的。从形式上看,

的可能值构成的可数集叫做该链的“状态空间”。

通常用一系列有向图来描述马尔可夫链,其中图的边用从时刻的状态到时刻的状态的概率 Pr ( X n + 1 = x X n = x n ) {displaystyle Pr(X_{n+1}=xmid X_{n}=x_{n})} 到时刻的转移矩阵表示同样的信息。但是,马氏链常常被假定为时齐的(见下文的变种),在这种情况下,图和矩阵与无关,因此也不表现为序列。

这些描述强调了马尔可夫链与初始分布 Pr ( X 1 = x 1 ) {displaystyle Pr(X_{1}=x_{1})} 到的概率非零,但到位于图的不同连通分量,那么 Pr ( X n + 1 = b | X n = a ) {displaystyle Pr(X_{n+1}=b|X_{n}=a)} 步从状态到状态的概率为

而单步转移是

对于一个时齐马尔可夫链来说:

步转移概率满足查普曼-科尔莫戈罗夫等式,对任意使得0 <  < ,

其中为此马尔可夫链的状态空间。

边缘分布Pr( = )为第次状态的分布。初始分布为Pr(0 = )。用一步转移把过程演变描述为

注意:上标()是索引而非指数。

马尔可夫链是由一个条件分布来表示的

这被称为是随机过程中的“转移概率”。这有时也被称作是“一步转移概率”。二、三,以及更多步的转移概率可以导自一步转移概率和马尔可夫性质:

同样,

这些式子可以通过乘以转移概率并求 k 1 {displaystyle k-1} 求和:

所以,对于可反转马尔可夫链,总是一个平稳分布。

伯努利方案是马尔可夫链的一种特殊情形,其转移概率矩阵有相同的行,即下一状态均匀独立于当前状态(除了独立于过往状态以外)。 仅有两个可能状态的伯努利方案是伯努利过程。

对于一般状态空间上的马尔可夫链的概述,详见文章状态空间可测的马尔可夫链。

马尔可夫系统广泛出现在热力学和统计力学中,

隐马尔科夫模型是大多数现代自动语音识别系统的基础。

谷歌所使用的网页排序算法(PageRank)就是由马尔可夫链定义的。如果 N {displaystyle N} 是已知的网页数量,一个页面 i {displaystyle i} k i {displaystyle k_{i}} 个链接到这个页面,那么它到链接页面的转换概率为 α k i + 1 α N {displaystyle {frac {alpha }{k_{i}}}+{frac {1-alpha }{N}}} ,到未链接页面的概率为 1 α N {displaystyle {frac {1-alpha }{N}}} , 参数 α {displaystyle alpha } 的取值大约为0.85。

马尔可夫模型也被应用于分析用户浏览网页的行为。一阶或者二阶的马尔可夫模型可以用于对一个用户从某一网络链接转移到另一链接的行为进行建模,然后这些模型可以用于对用户之后的浏览行为进行预测。

马尔科夫链可以应用于金融与经济中一系列现象的建模,包括资产价值与市场冲击。1974年Prasad等人第一次应用马尔科夫链于金融模型,另一个是James D. Hamilton 1989年应用的机制转换模型,其中马尔科夫链用来对高GDP增长速度时期与低GDP增长速度时期(换言之,经济扩张与紧缩)的转换进行建模。

马尔可夫链也有众多的生物学应用,特别是增殖过程,可以帮助模拟生物增殖过程的建模。隐蔽马尔可夫模型还被用于生物信息学,用以编码区域或基因预测(见哈代-温伯格定律。)

马尔可夫过程,能为给定样品文本,生成粗略,但看似真实的文本:他们被用于众多供消遣的“模仿生成器”软件。马尔可夫链还被用于谱曲。

用于计算马尔可夫信源的极限熵

马尔可夫在1906年首先做出了这类过程。而将此一般化到可数无限状态空间是由俄国数学家柯尔莫果洛夫(俄语:Андре́й Никола́евич Колмого́ров)在1936年给出的。马尔可夫链与布朗运动以及遍历假说这两个二十世纪初期物理学重要课题是相联系的,但马尔可夫寻求的似乎不仅于数学动机,名义上是对于纵属事件大数法则的扩张。

相关

  • 停车场停车场是供车辆停放之场所。停车场有仅画停车格而无人管理及收费的简易停车场,亦有配有出入栏口、泊车管理员及计时收款员的收费停车场。现代化的停车场常有自动化计时收费系
  • .my.my为马来西亚国家和地区顶级域(ccTLD)的域名。由马来西亚网络资讯中心负责管理、注册。此外还拥有阿拉伯文顶级域名مليسيا.‎,但暂不确定是否启用。申请者能够自由的决
  • 国立台北科技大学附属桃园农工高级中等学校国立台北科技大学附属桃园农工高级中等学校(英语:The Affiliated Tao-Yuan Agricultural & Industrial Senior High School of National Taipei University of Technology),简称
  • 三苯基䏲三苯基䏲是一种有机锑化合物,化学式为Sb(C6H5)3。它可以缩写为SbPh3。这种无色固体通常被认为是有机锑化合物的原型。它在配位化学中用作配体,有机合成中用作试剂。SbPh3最早
  • 甘查尔·普拉诺沃甘查尔·普拉诺沃(印尼语:Ganjar Pranowo,爪哇语:Ganjar Pranowo,ꦓꦚ꧀ꦗꦂꦦꦿꦤꦮ ;1968年10月28日-),印度尼西亚政治人物,第14任中爪哇省省长。他在任期间曾试图重组行政部门,命令
  • 不信 (佛教)在佛教中,不信(梵语:Āśraddhya),是没有信心,缺乏信仰的意思,特别是用来指对于佛、法、僧三宝与四圣谛缺少清净的认知,没有正确了解。是一种心所,说一切有部将其归于大烦恼地法。在
  • 高颖 (1927年)高颖(1927年10月-),辽宁省台安县人,中华人民共和国画家。1945年,毕业于依安国民高等学校。1946年参加解放军。1948年,毕业于哈尔滨东北画报社美术训练班后,曾任东北画报记者、编审等
  • 天下长安《天下长安》(英语:The World of Chang'An),待播的中国大陆唐代古装电视剧,改编自董哲的小说《李世民:从玄武门到天下长安》。讲述在隋末唐初的乱世之争里,唐太宗李世民如何开创李
  • 芬尼氏菌属芬尼氏菌属(学名:)为着色菌目着色杆菌科的一属细菌。此属的模式种且为唯一种为紫芬尼氏菌()。
  • 安琪 (诗人)安琪(1969年-),出生于福建漳州,原名黄江嫔,中国现代诗人,中间代概念的发起人之一,也是丑石诗群成员以及第三条道路诗群的代表诗人之一。安琪于1988年7月毕业于漳州师院中文系。大学期间开始诗歌创作,其作品在各种文学刊物上出版,现居北京。诗作入选《中间代诗全集》《现代中国文学精品文库·诗歌卷》《感动大学生的100首诗歌》《新世纪十佳青年女诗人诗选》及各种年度诗歌选本等,主编有《中间代诗全集》(与远村、黄礼孩合作,海峡文艺出版社2004年出版)等。安琪曾经于1995年获第四届柔刚诗歌年奖,2003年获首届