自动机理论

✍ dations ◷ 2025-06-08 03:00:10 #自动机,形式语言,计算模型,计算机科学,理论计算机科学

在理论计算机科学中,自动机理论是对抽象机和它们能解决的问题的研究。自动机理论密切关联于形式语言理论,因为自动机经常按它们所能识别的形式语言类来分类。

自动机是有限状态机(FSM)的数学模型。FSM是给定符号输入,依据(可表达为一个表格的)转移函数“跳转”过一系列状态的一种机器。在常见的FSM的“米利型有限状态机”(Mealy)变体中,这个转移函数告诉自动机给定当前状态和当前字符的时候下一个状态是什么。

逐个读取输入中的符号,直到被完全耗尽(把它当作有一个字写在其上的磁带,通过自动机的读磁头来读取它;磁头在磁带上前行移动,一次读一个符号)。一旦输入被耗尽,自动机被称为“停止”了。

依赖自动机停止时的状态,称呼这个自动机要么是“接受”要么“拒绝”这个输入。如果停止于“接受状态”,则自动机“接受”了这个字。在另一方面,如果它停止于“拒绝状态”,则这个字被“拒绝”。自动机接受的所有字的集合被称为“这个自动机接受的语言”。

但要注意,自动机一般不必须有有限数目甚至可数个状态。比如,量子有限自动机有不可数无限个状态,因为所有可能状态的集合是在复投影空间中所有点的集合。所以,量子有限自动机和有限状态机一样,都是更一般想法拓扑自动机的特殊情况,它的状态的集合是拓扑空间,而状态转移函数取自在这个空间上的所有可能函数。拓扑自动机经常叫做 M-自动机,简单是半自动机加上接受状态集合的补充,这里的集合交集确定初始状态是被接受还是被拒绝。

一般的说,自动机不需要严格的接受或拒绝一个输入;它可以按某个在零和一之间的概率接受它。还是用量子有限自动机作为展示例子,它只按某个概率接受输入。这个想法也是更一般情况几何自动机或度量自动机的特殊情况,它的状态的集合是度量空间,一个语言被这个自动机接受如果在初始点和接受状态的集合之间的距离关于这个度量是足够的小。

自动机有如下基本概念:

自动机可以表示为5-元组 Q , Σ , δ , q 0 , F {\displaystyle \langle Q,\Sigma ,\delta ,q_{0},F\rangle } 的集合,当给定为自动机的输入的时候,将导致它停止于 F {\displaystyle F} 是有限的时候,自动机被称为有限状态自动机,而所有可识别的语言是正则语言。事实上,有一个强等价: 对于所有正则语言,都有一个有限状态自动机,反之亦然。

如上所述,集合 不必须是有限或可数的;它可以采用一般的拓扑空间;这就得到了一般的拓扑自动机。另一种可能的推广是度量自动机或“几何自动机”。在这种情况下,改变了对语言的接受: 替代在 δ ^ ( q 0 , w ) F {\displaystyle {\widehat {\delta }}(q_{0},w)\in F} 中的最终状态的集合包含,以在最终状态 δ ^ ( q 0 , w ) {\displaystyle {\widehat {\delta }}(q_{0},w)} 和集合 F {\displaystyle F} 之间的度量距离的方式给出。特定类型的概率自动机是度量自动机,其度量空间是在概率空间上的测量。

下面是三类有限自动机

尽管可以证明所有这些自动机都“可以接受同样的语言”。你总是可以构造接受与给定的 NFA M 同样语言的某个 DFA M。

上述自动机接受的语言家族被称为正则语言家族。更强力的自动机可以接受更复杂的语言。比如:

根据 Myhill-Nerode定理,在同构意义下接受一个正则语言的最少状态的确定有限状态自动机是唯一的。同时我们还存在有效的算法(时间开销是O(n2)的)构造出与给定确定有限状态自动机等价的最小化的确定有限状态自动机。

确定有限状态自动机与非确定有限状态自动机识别的语言都是正则语言。由于正则语言的良好性质,许多为其他自动机(下推自动机或图灵机)不能判定的问题,在有限状态自动机的情形下,都可以得到判定,并且存在有效的算法。

对一个确定有限状态自动机,下述判定问题都可以判定,并且存在有效的算法。

相关

  • 岩石层岩石圈位于地球的表层,薄而坚硬。岩石圈在软流圈之上,包含部分上地幔和地壳。地壳在地幔之上,由莫氏不连续面作为分界。根据板块构造学说,岩石圈并非整体一块,而是由许多板块组成
  • 现代化现代化(英语:Modernization),又译近代化,该词常被用来描述现代发生的社会和文化变迁的现象。根据马格纳雷拉(Paul J. Magnarella)的定义,现代化是发展中的社会为了获得发达的工业社
  • 方仙道方仙道或神仙家是在春秋、战国时期形成的一类专门从事方术、方技等道术的人,时称方士。包括天文、医学、神仙、占卜、相术、堪舆等技艺并宣传服食、祭祀可以长生成仙的人。据
  • 龚岳亭龚岳亭(1928年4月5日-2014年12月27日),上海人,中国生物化学家。1949年冬毕业于上海圣约翰大学化学系。中国科学院上海生物化学研究所研究员,兼任上海计划生育科学研究所所长、名誉
  • 公差公差是机械和建筑工程行业基础标准中所规定的一系列数值范围即规定了误差的允许范围,给出了与标定值相偏差的极限容许量。国家标准将加工精度标准化即规定了标准公差数值。尺
  • 抽象形态抽象化(英语:Abstraction)是指以缩减一个概念或是一个现象的资讯含量来将其广义化(Generalization)的过程,主要是为了只保存和一特定目的有关的资讯。例如,将一个皮制的足球抽象化
  • 第一型和第二型误差第一型及第二型错误(英语:Type I error & Type II error)或型一错误及型二错误为统计学中推论统计学的名词。在假设检验中,有一种假设称为“零假设(虚无假设)”;假设检验的目的是利
  • 百威捷克布杰约维采(捷克语:České Budějovice,捷克语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode"
  • 吉留伊河吉留伊河是俄罗斯的河流,由阿穆尔州负责管辖,属于结雅的右支流,河道全长545公里,流域面22,500平方公里,发源自外兴安岭,河水主要来自融雪。
  • 2012我爱HK喜上加囍《2012我爱HK喜上加囍》(英语:)是一部由邵氏影城有限公司与电视广播有限公司合作拍摄的贺岁喜剧电影,由曾志伟、毛舜筠、黄宗泽、何韵诗、冯淬帆、邵音音、苏永康、麦长青、陆永