自动机理论

✍ dations ◷ 2025-06-30 02:49:26 #自动机,形式语言,计算模型,计算机科学,理论计算机科学

在理论计算机科学中,自动机理论是对抽象机和它们能解决的问题的研究。自动机理论密切关联于形式语言理论,因为自动机经常按它们所能识别的形式语言类来分类。

自动机是有限状态机(FSM)的数学模型。FSM是给定符号输入,依据(可表达为一个表格的)转移函数“跳转”过一系列状态的一种机器。在常见的FSM的“米利型有限状态机”(Mealy)变体中,这个转移函数告诉自动机给定当前状态和当前字符的时候下一个状态是什么。

逐个读取输入中的符号,直到被完全耗尽(把它当作有一个字写在其上的磁带,通过自动机的读磁头来读取它;磁头在磁带上前行移动,一次读一个符号)。一旦输入被耗尽,自动机被称为“停止”了。

依赖自动机停止时的状态,称呼这个自动机要么是“接受”要么“拒绝”这个输入。如果停止于“接受状态”,则自动机“接受”了这个字。在另一方面,如果它停止于“拒绝状态”,则这个字被“拒绝”。自动机接受的所有字的集合被称为“这个自动机接受的语言”。

但要注意,自动机一般不必须有有限数目甚至可数个状态。比如,量子有限自动机有不可数无限个状态,因为所有可能状态的集合是在复投影空间中所有点的集合。所以,量子有限自动机和有限状态机一样,都是更一般想法拓扑自动机的特殊情况,它的状态的集合是拓扑空间,而状态转移函数取自在这个空间上的所有可能函数。拓扑自动机经常叫做 M-自动机,简单是半自动机加上接受状态集合的补充,这里的集合交集确定初始状态是被接受还是被拒绝。

一般的说,自动机不需要严格的接受或拒绝一个输入;它可以按某个在零和一之间的概率接受它。还是用量子有限自动机作为展示例子,它只按某个概率接受输入。这个想法也是更一般情况几何自动机或度量自动机的特殊情况,它的状态的集合是度量空间,一个语言被这个自动机接受如果在初始点和接受状态的集合之间的距离关于这个度量是足够的小。

自动机有如下基本概念:

自动机可以表示为5-元组 Q , Σ , δ , q 0 , F {\displaystyle \langle Q,\Sigma ,\delta ,q_{0},F\rangle } 的集合,当给定为自动机的输入的时候,将导致它停止于 F {\displaystyle F} 是有限的时候,自动机被称为有限状态自动机,而所有可识别的语言是正则语言。事实上,有一个强等价: 对于所有正则语言,都有一个有限状态自动机,反之亦然。

如上所述,集合 不必须是有限或可数的;它可以采用一般的拓扑空间;这就得到了一般的拓扑自动机。另一种可能的推广是度量自动机或“几何自动机”。在这种情况下,改变了对语言的接受: 替代在 δ ^ ( q 0 , w ) F {\displaystyle {\widehat {\delta }}(q_{0},w)\in F} 中的最终状态的集合包含,以在最终状态 δ ^ ( q 0 , w ) {\displaystyle {\widehat {\delta }}(q_{0},w)} 和集合 F {\displaystyle F} 之间的度量距离的方式给出。特定类型的概率自动机是度量自动机,其度量空间是在概率空间上的测量。

下面是三类有限自动机

尽管可以证明所有这些自动机都“可以接受同样的语言”。你总是可以构造接受与给定的 NFA M 同样语言的某个 DFA M。

上述自动机接受的语言家族被称为正则语言家族。更强力的自动机可以接受更复杂的语言。比如:

根据 Myhill-Nerode定理,在同构意义下接受一个正则语言的最少状态的确定有限状态自动机是唯一的。同时我们还存在有效的算法(时间开销是O(n2)的)构造出与给定确定有限状态自动机等价的最小化的确定有限状态自动机。

确定有限状态自动机与非确定有限状态自动机识别的语言都是正则语言。由于正则语言的良好性质,许多为其他自动机(下推自动机或图灵机)不能判定的问题,在有限状态自动机的情形下,都可以得到判定,并且存在有效的算法。

对一个确定有限状态自动机,下述判定问题都可以判定,并且存在有效的算法。

相关

  • 脑疝疝(Hernia),俗称疝气,其最初的意义是“腹痛”,但后世多特指“少腹坠痛”的狐疝,相当于现代医学的“腹股沟疝”。医学上的疝气指的是器官,例如肠子,经由腔室的孔道离开原先的位置。有
  • 卡洛林帝国加洛林王朝(法语:les Carolingiens,旧称Carlovingiens,中世纪拉丁语:Karolingi,又译卡洛林王朝)是自公元751年后统治法兰克王国的王朝。在此之前,其王朝成员以“宫相”的身份涉理王
  • 癌德星环磷酰胺(Cyclophosphamide)。为oxazophorines的衍生物。其药物化学机制为:由于环磷酰胺具有减低或停止细胞生长的功能,所以常和其他免疫抑制剂一起用来治疗淋巴瘤 、某些脑癌
  • 悬崖悬崖是角度垂直或接近角度垂直的暴露岩石,是一种被侵蚀、风化的地形。悬崖常见于海岸、河岸、山区及断崖(escarpment)里,瀑布的支流常常流经。悬崖的地质多属火成岩(例如花岗岩及
  • 露梁海战釜山镇 – 多大浦 – 东莱城 – 尚州 – 忠州弹琴台 – 玉浦 – 泗川 – 临津江 – 唐浦 – 唐项浦 – 闲山岛 – 龙仁 – 梨峙 – 平壤 – 釜山浦 – 北关
  • 林 颙林颙,福建漳浦县旧镇大油甘人,清朝政治人物。顺治十五年(1658年)戊戌科进士,授德化县知县。
  • 梅萨县梅萨县(英语:Mesa County, Colorado)是美国科罗拉多州西部的一个县,西与犹他州相连。面积8,653平方公里。根据美国2000年人口普查,共有人口116,255人。县治大章克申(Grand Junctio
  • 名称来源美国50个州份的名称源自不同的语言。当中24个州名来自美洲原住民语言:8个源自阿尔冈昆语、7个源自苏语(英语:Siouan languages)(其中1个经阿尔冈昆语之一的迈阿密-伊利诺伊语(英语
  • 西路京东西路是中国宋朝(960年-1279年)的一个地方行政区,地处北宋首都东京开封府的东部。宋仁宗庆历二年(1042年),初置京东西路安抚使。熙宁五年(1072年)正式分京东路为京东东路和京东西
  • 啄花鸟科啄花鸟科(学名:Dicaeidae)属于雀形目。啄花鸟科各种类统称,分为两属。啄花鸟科一类为羽色鲜丽、体态纤小的鸣禽。嘴短略呈三角形,靠近先端的啮缘具有细锯齿。短尾,粗喙,管状的舌头,