形式语言

✍ dations ◷ 2025-11-29 00:24:32 #形式语言
在数学、逻辑和计算机科学中,形式语言(英语:Formal language)是用精确的数学或机器可处理的公式定义的语言。如语言学中语言一样,形式语言一般有两个方面:语法和语义。专门研究语言的语法的数学和计算机科学分支叫做形式语言理论,它只研究语言的语法而不致力于它的语义。在形式语言理论中,形式语言是一个字母表上的某些有限长字符串的集合。一个形式语言可以包含无限多个字符串。语言定义在某一个特定的字母表上,字母表(经常记作 Σ )可以为任意有限集合。例如集合 { a , b , c . . . , z } {displaystyle {a,b,c...,z}} 就表示所有小写字母构成的字母表。字符串是字母表中的元素构成的有穷序列,以之前定义的小写字母表为例,“hello”,“wikipedia”,“abcjkg”都是上面的串,而“AbCd”就不是上面的串了。记号 ε 表示空串——它是一个特殊的长度为0的串。直觉上,一个语言是字母表所能构成的所有串的集合的一个子集,具体来说:对于任意一个字母表,记全体长度为 n 的子串为 Σ n {displaystyle Sigma ^{n}} ,特别的,规定 Σ 0 {displaystyle Sigma ^{0}} 为{ε},则还可以定义Σ ∗ = Σ 0 ∪ Σ 1 ∪ ⋯ ∪ Σ n ∪ ⋯ {displaystyle Sigma ^{*}=Sigma ^{0}cup Sigma ^{1}cup cdots cup Sigma ^{n}cup cdots }Σ ∗ {displaystyle Sigma ^{*}} 包含了字母表 Σ {displaystyle Sigma } 所能构成的所有字符串。语言(一般记为 L )定义为 Σ ∗ {displaystyle Sigma ^{*}} 的任意子集。下面给出一些语言的例子, { h e l l o , w o r l d } {displaystyle {hello,world}} 是一个包含两个字符串的集合,也可以被视为小写字母构成的字母表上的一个语言。而实际上研究的语言的例子则常常更为复杂,例如所有合法的C语言程序串构成的集合也可以视作ASCII上的一个语言(假定编译器只支持英文符号)。需要注意的一点是, Σ ∗ {displaystyle Sigma ^{*}} 的空子集 ∅ 与只包含空串的语言 {ε} 是两个不同的语言。语言间的运算就是 Σ*幂集上的运算。不像自然语言,一个形式语言作为一个集合,需要有某种明确的标准来定义一个字符串是否是它的元素。这可以通过多种方法来完成,下面将给出一些例子:如果一个形式语言的元素数目是有限的,那么可以通过枚举它的各个字符串来严格地定义它。通过形式文法来产生(参见乔姆斯基谱系)。正则表达式是一种很多编程语言和库都支持的语法,这种语法可以用于匹配符合一定条件的字符串,经常用于文本的搜索和过滤。从名称上来说,正则表达式应当是对应于正则语言的,在形式语言领域内所称的正则表达式确实如此。不过,在实际的编程语言中,很多正则表达式已经通过引入复杂的扩展,可以匹配正则表达式所不能描述的内容。形式语言中的正则表达式和一般编程语言中所称的正则表达式在语法上也有较大差异。直觉上来说,自动机消耗输入符号,并在自身的不同状态间转移,可以通过状态机消耗完整个字符串之后是否达到某些特定状态来定义一个字符串是否属于某一个语言。语言可以通过某种自动机来识别,比如图灵机、有限状态自动机。

相关

  • 衰老人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学在生物学及医学上,老化是生理状态随时
  • 巴尔的摩病毒分类系统巴尔的摩病毒分类系统(Baltimore classification)是一种由戴维·巴尔的摩建立的以基因组和病毒转录mRNA方式为区分的病毒分类系统。世界上的病毒千奇百怪,数量极多,生活周期又各
  • 叶酸叶酸(Folate、folic acid)也称为维生素B9、维生素M、维生素Bc,属于维生素B。叶酸可用于治疗由叶酸缺乏症引起的贫血。叶酸也是孕妇的营养补充品。在新生儿的神经管缺损(英语:Neur
  • 非类固醇消炎止痛药非甾体消炎药(英语:Non-Steroidal Anti-Inflammatory Drug,縮寫作NSAID),也译作非类固醇抗炎药,是一类具有解热镇痛效果的药物,在施用较高剂量时也具有消炎作用。“非甾体”一词用
  • 人体免疫缺损病毒人类免疫缺陷病毒(英语:human immunodeficiency virus,簡稱HIV,又称艾滋病毒)是一种感染人类免疫系统细胞的慢病毒,属逆转录病毒的一种。普遍认为,人类免疫缺陷病毒的感染导致艾滋
  • 主要机构《联合国宪章》规定,联合国有六大主要机构:联合国大会、安全理事会、经济及社会理事会、托管理事会、秘书处和国际法院。其中,托管理事会随着联合国最后一块托管领土帕劳的独立
  • 反义链(英语:Sense,也称股)在分子生物学中指一段核酸分子(如RNA与DNA)及其互补序列在指定氨基酸序列中的作用性质。例如,若RNA可以直接合成蛋白质,则该段RNA为正链;反之,若RNA需要先进行转
  • 米兹拉希犹太人米兹拉希犹太人(希伯来语:מזרחים,现代 Mizraḥim,提比里安 Mizrāḥîm,意为“东方人”),为居于中东、中亚和高加索地区的犹太人的后裔。现有人口约175万人,其中超过130万居于
  • 客体客体或对象(Object)在哲学上指可感知或可想像到的任何事物,既包括客观存在并可观察到的事物(如人物、树木、房屋,抽象的如物价、自由),也包括想像的事物(如神化人物)。
  • 孤立语系孤立语言,一般指与其他任何语言不存在亲属关系的自然语言,无法分类到任何已知语系中。知名的孤立语言如朝鲜语和日语(上述两者均存在争议)。孤立语言可以看做特殊的未分类语言,即