自动机理论

✍ dations ◷ 2025-04-26 12:30:33 #自动机,形式语言,计算模型,计算机科学,理论计算机科学

在理论计算机科学中,自动机理论是对抽象机和它们能解决的问题的研究。自动机理论密切关联于形式语言理论,因为自动机经常按它们所能识别的形式语言类来分类。

自动机是有限状态机(FSM)的数学模型。FSM是给定符号输入,依据(可表达为一个表格的)转移函数“跳转”过一系列状态的一种机器。在常见的FSM的“米利型有限状态机”(Mealy)变体中,这个转移函数告诉自动机给定当前状态和当前字符的时候下一个状态是什么。

逐个读取输入中的符号,直到被完全耗尽(把它当作有一个字写在其上的磁带,通过自动机的读磁头来读取它;磁头在磁带上前行移动,一次读一个符号)。一旦输入被耗尽,自动机被称为“停止”了。

依赖自动机停止时的状态,称呼这个自动机要么是“接受”要么“拒绝”这个输入。如果停止于“接受状态”,则自动机“接受”了这个字。在另一方面,如果它停止于“拒绝状态”,则这个字被“拒绝”。自动机接受的所有字的集合被称为“这个自动机接受的语言”。

但要注意,自动机一般不必须有有限数目甚至可数个状态。比如,量子有限自动机有不可数无限个状态,因为所有可能状态的集合是在复投影空间中所有点的集合。所以,量子有限自动机和有限状态机一样,都是更一般想法拓扑自动机的特殊情况,它的状态的集合是拓扑空间,而状态转移函数取自在这个空间上的所有可能函数。拓扑自动机经常叫做 M-自动机,简单是半自动机加上接受状态集合的补充,这里的集合交集确定初始状态是被接受还是被拒绝。

一般的说,自动机不需要严格的接受或拒绝一个输入;它可以按某个在零和一之间的概率接受它。还是用量子有限自动机作为展示例子,它只按某个概率接受输入。这个想法也是更一般情况几何自动机或度量自动机的特殊情况,它的状态的集合是度量空间,一个语言被这个自动机接受如果在初始点和接受状态的集合之间的距离关于这个度量是足够的小。

自动机有如下基本概念:

自动机可以表示为5-元组 Q , Σ , δ , q 0 , F {\displaystyle \langle Q,\Sigma ,\delta ,q_{0},F\rangle } 的集合,当给定为自动机的输入的时候,将导致它停止于 F {\displaystyle F} 是有限的时候,自动机被称为有限状态自动机,而所有可识别的语言是正则语言。事实上,有一个强等价: 对于所有正则语言,都有一个有限状态自动机,反之亦然。

如上所述,集合 不必须是有限或可数的;它可以采用一般的拓扑空间;这就得到了一般的拓扑自动机。另一种可能的推广是度量自动机或“几何自动机”。在这种情况下,改变了对语言的接受: 替代在 δ ^ ( q 0 , w ) F {\displaystyle {\widehat {\delta }}(q_{0},w)\in F} 中的最终状态的集合包含,以在最终状态 δ ^ ( q 0 , w ) {\displaystyle {\widehat {\delta }}(q_{0},w)} 和集合 F {\displaystyle F} 之间的度量距离的方式给出。特定类型的概率自动机是度量自动机,其度量空间是在概率空间上的测量。

下面是三类有限自动机

尽管可以证明所有这些自动机都“可以接受同样的语言”。你总是可以构造接受与给定的 NFA M 同样语言的某个 DFA M。

上述自动机接受的语言家族被称为正则语言家族。更强力的自动机可以接受更复杂的语言。比如:

根据 Myhill-Nerode定理,在同构意义下接受一个正则语言的最少状态的确定有限状态自动机是唯一的。同时我们还存在有效的算法(时间开销是O(n2)的)构造出与给定确定有限状态自动机等价的最小化的确定有限状态自动机。

确定有限状态自动机与非确定有限状态自动机识别的语言都是正则语言。由于正则语言的良好性质,许多为其他自动机(下推自动机或图灵机)不能判定的问题,在有限状态自动机的情形下,都可以得到判定,并且存在有效的算法。

对一个确定有限状态自动机,下述判定问题都可以判定,并且存在有效的算法。

相关

  • 东医学东医学(越南语:Đông y),又称为越南传统医学(英语:Vietnamese Traditional Medicine),是一种传统医学,源自于汉医学。相对于西方医学,越南为东方,故称为东医学。越南东医学,又分成以中
  • 图拉州图拉州(俄语:Тульская область,罗马化:Tulskaya oblast),位于俄罗斯首都莫斯科以南,是俄罗斯联邦主体之一,属中央联邦管区。面积25,700平方公里,人口1,675,758 (2002
  • 二级相变二级相变(Second order phase transition)为化学势的二阶偏微分发生突变的一类相变。相变时没有热效应和熵变,但热膨胀系数,压缩系数,比热容这三个化学势的二阶偏微分量发生突变
  • 网页程序设计网页程序设计是指使用网页设计程序语言设计交互式的网页,又称动态网页,动态网页是指网页的内容是否可根据某种条件的改变而自动改变,如网页计数器(英语:web counter)就是动态的,当
  • 丹尼尔·笛福丹尼尔·笛福(Daniel Defoe,1660年9月13日-1731年4月24日),原名丹尼尔·福(Daniel Foe),英国小说家、新闻记者、小册子作者。其作品主要为个人通过努力,靠自己的智慧和勇敢战胜困难。
  • 蒙茅斯蒙茅斯郡(英语:Monmouthshire),是威尔士东南部的一个郡,源于历史上的蒙茅斯郡,大约占其固有面积的东部60%。最大的城镇为阿勃盖文尼(Abergavenny),其他主要的城镇有卡尔地括特(Caldico
  • 李玄伯李宗侗(1895年-1974年)字玄伯,直隶高阳人。中华民国历史学家。李宗侗生于清朝末年的世家大族,是大臣李鸿藻之孙,南皮张之万的外曾孙。早年,随叔父李石曾赴法国留学,毕业于巴黎大学。
  • 费尔菲尔德费尔菲尔德 (Fairfield, California)是美国加利福尼亚州索拉诺县县治。面积97.6平方公里,2006年人口104,897人。1859年建立,城名纪念创建者的家乡、康乃狄克州的费尔菲尔德。190
  • 1956年夏季奥林匹克运动会第十六届夏季奥林匹克运动会(英语:the Games of the XVI Olympiad,法语:les Jeux de la XVIe Olympiade,瑞典语:XVI Olympiaden),于1956年11月22日至12月8日在澳大利亚墨尔本举行,其
  • 卡卢加-里加线.mw-parser-output .RMbox{box-shadow:0 2px 2px 0 rgba(0,0,0,.14),0 1px 5px 0 rgba(0,0,0,.12),0 3px 1px -2px rgba(0,0,0,.2)}.mw-parser-output .RMinline{float:none