形式语言

✍ dations ◷ 2025-04-26 13:02:48 #形式语言
在数学、逻辑和计算机科学中,形式语言(英语:Formal language)是用精确的数学或机器可处理的公式定义的语言。如语言学中语言一样,形式语言一般有两个方面:语法和语义。专门研究语言的语法的数学和计算机科学分支叫做形式语言理论,它只研究语言的语法而不致力于它的语义。在形式语言理论中,形式语言是一个字母表上的某些有限长字符串的集合。一个形式语言可以包含无限多个字符串。语言定义在某一个特定的字母表上,字母表(经常记作 Σ )可以为任意有限集合。例如集合 { a , b , c . . . , z } {displaystyle {a,b,c...,z}} 就表示所有小写字母构成的字母表。字符串是字母表中的元素构成的有穷序列,以之前定义的小写字母表为例,“hello”,“wikipedia”,“abcjkg”都是上面的串,而“AbCd”就不是上面的串了。记号 ε 表示空串——它是一个特殊的长度为0的串。直觉上,一个语言是字母表所能构成的所有串的集合的一个子集,具体来说:对于任意一个字母表,记全体长度为 n 的子串为 Σ n {displaystyle Sigma ^{n}} ,特别的,规定 Σ 0 {displaystyle Sigma ^{0}} 为{ε},则还可以定义Σ ∗ = Σ 0 ∪ Σ 1 ∪ ⋯ ∪ Σ n ∪ ⋯ {displaystyle Sigma ^{*}=Sigma ^{0}cup Sigma ^{1}cup cdots cup Sigma ^{n}cup cdots }Σ ∗ {displaystyle Sigma ^{*}} 包含了字母表 Σ {displaystyle Sigma } 所能构成的所有字符串。语言(一般记为 L )定义为 Σ ∗ {displaystyle Sigma ^{*}} 的任意子集。下面给出一些语言的例子, { h e l l o , w o r l d } {displaystyle {hello,world}} 是一个包含两个字符串的集合,也可以被视为小写字母构成的字母表上的一个语言。而实际上研究的语言的例子则常常更为复杂,例如所有合法的C语言程序串构成的集合也可以视作ASCII上的一个语言(假定编译器只支持英文符号)。需要注意的一点是, Σ ∗ {displaystyle Sigma ^{*}} 的空子集 ∅ 与只包含空串的语言 {ε} 是两个不同的语言。语言间的运算就是 Σ*幂集上的运算。不像自然语言,一个形式语言作为一个集合,需要有某种明确的标准来定义一个字符串是否是它的元素。这可以通过多种方法来完成,下面将给出一些例子:如果一个形式语言的元素数目是有限的,那么可以通过枚举它的各个字符串来严格地定义它。通过形式文法来产生(参见乔姆斯基谱系)。正则表达式是一种很多编程语言和库都支持的语法,这种语法可以用于匹配符合一定条件的字符串,经常用于文本的搜索和过滤。从名称上来说,正则表达式应当是对应于正则语言的,在形式语言领域内所称的正则表达式确实如此。不过,在实际的编程语言中,很多正则表达式已经通过引入复杂的扩展,可以匹配正则表达式所不能描述的内容。形式语言中的正则表达式和一般编程语言中所称的正则表达式在语法上也有较大差异。直觉上来说,自动机消耗输入符号,并在自身的不同状态间转移,可以通过状态机消耗完整个字符串之后是否达到某些特定状态来定义一个字符串是否属于某一个语言。语言可以通过某种自动机来识别,比如图灵机、有限状态自动机。

相关

  • 缓激肽结构 / ECOD缓激肽(英语:Bradykinin)是引起血管扩张的一种肽,因此导致血压降低。一类名叫ACE抑制药的用于降血压的药物会增加缓激肽的浓度(通过抑制其降解)进而降低血压。缓激肽是
  • 网状内皮系统单核吞噬细胞系统(英语:Mononuclear phagocyte system、MPS)是高等动物免疫系统的一部分,由可以进行吞噬作用的细胞组成 。通常存在于网状结缔组织(reticular connective tissue)
  • GM-CSFn/an/an/an/an/an/an/an/an/an/a结构 / ECOD粒细胞-巨噬细胞集落刺激因子(granulocyte-macrophage colony-stimulating factor,GM-CSF),又名集落刺激因子2(colony-stimulating fa
  • 牙膏牙膏是一种洁齿剂,一般呈凝胶状,通常会抹在牙刷上用于清洁牙齿保持牙齿美观和亮白。牙膏是用来提高口腔健康问题的:它提供了充足的摩擦力,协助清洁牙齿、牙龈间的牙菌斑、食物等
  • 肌钙蛋白肌钙蛋白(英语:Troponin)是由三种调节蛋白(肌钙蛋白C、肌钙蛋白I(英语:troponin I)和肌钙蛋白T(英语:troponin T))组成的复合物,是骨骼肌和心肌(不包括平滑肌)肌肉收缩不可或缺的组分。
  • 帕斯卡布莱兹‧帕斯卡(Blaise Pascal,1623年6月19日-1662年8月19日),法国神学家、哲学家、数学家、物理学家、化学家、音乐家、教育家、气象学家。帕斯卡早期进行自然和应用科学的研究,
  • 金银潭医院武汉市金银潭医院是一家位于中华人民共和国湖北省武汉市东西湖区的一家公立医院,是武汉市卫生健康委员会直属单位,三级甲等专科医院。武汉市金银潭医院是湖北省和武汉市突发公
  • 恶性黑色素瘤黑色素瘤,又称恶性黑色素瘤,是一种从黑色素细胞发展而来的癌症,是皮肤癌中罕见的癌症。好发于皮肤但也可能出现在口腔、肠道或眼睛中。女性患者的黑色素瘤最常出现在腿,而男性患
  • 甘氨酸甘氨酸(英语:Glycine,简写为Gly或G),即胺基乙酸,是20个蛋白氨基酸中分子量最小的一个。它是白色或浅黄色晶体,易溶于水,有甜味。甘氨酸的侧键是一个氢原子。甘氨酸的α碳连接两个氢
  • 摹状词理论摹状词理论(theory of descriptions 或 Russell's Theory of Descriptions,简称RTD)是数理逻辑、语言哲学和分析哲学上的一个极重要的理论,被誉为分析哲学的典范。运用这个理论