首页 >
形式语言
✍ dations ◷ 2025-12-08 12:45:36 #形式语言
在数学、逻辑和计算机科学中,形式语言(英语:Formal language)是用精确的数学或机器可处理的公式定义的语言。如语言学中语言一样,形式语言一般有两个方面:语法和语义。专门研究语言的语法的数学和计算机科学分支叫做形式语言理论,它只研究语言的语法而不致力于它的语义。在形式语言理论中,形式语言是一个字母表上的某些有限长字符串的集合。一个形式语言可以包含无限多个字符串。语言定义在某一个特定的字母表上,字母表(经常记作 Σ )可以为任意有限集合。例如集合
{
a
,
b
,
c
.
.
.
,
z
}
{displaystyle {a,b,c...,z}}
就表示所有小写字母构成的字母表。字符串是字母表中的元素构成的有穷序列,以之前定义的小写字母表为例,“hello”,“wikipedia”,“abcjkg”都是上面的串,而“AbCd”就不是上面的串了。记号 ε 表示空串——它是一个特殊的长度为0的串。直觉上,一个语言是字母表所能构成的所有串的集合的一个子集,具体来说:对于任意一个字母表,记全体长度为 n 的子串为
Σ
n
{displaystyle Sigma ^{n}}
,特别的,规定
Σ
0
{displaystyle Sigma ^{0}}
为{ε},则还可以定义Σ
∗
=
Σ
0
∪
Σ
1
∪
⋯
∪
Σ
n
∪
⋯
{displaystyle Sigma ^{*}=Sigma ^{0}cup Sigma ^{1}cup cdots cup Sigma ^{n}cup cdots }Σ
∗
{displaystyle Sigma ^{*}}
包含了字母表
Σ
{displaystyle Sigma }
所能构成的所有字符串。语言(一般记为 L )定义为
Σ
∗
{displaystyle Sigma ^{*}}
的任意子集。下面给出一些语言的例子,
{
h
e
l
l
o
,
w
o
r
l
d
}
{displaystyle {hello,world}}
是一个包含两个字符串的集合,也可以被视为小写字母构成的字母表上的一个语言。而实际上研究的语言的例子则常常更为复杂,例如所有合法的C语言程序串构成的集合也可以视作ASCII上的一个语言(假定编译器只支持英文符号)。需要注意的一点是,
Σ
∗
{displaystyle Sigma ^{*}}
的空子集 ∅ 与只包含空串的语言 {ε} 是两个不同的语言。语言间的运算就是 Σ*幂集上的运算。不像自然语言,一个形式语言作为一个集合,需要有某种明确的标准来定义一个字符串是否是它的元素。这可以通过多种方法来完成,下面将给出一些例子:如果一个形式语言的元素数目是有限的,那么可以通过枚举它的各个字符串来严格地定义它。通过形式文法来产生(参见乔姆斯基谱系)。正则表达式是一种很多编程语言和库都支持的语法,这种语法可以用于匹配符合一定条件的字符串,经常用于文本的搜索和过滤。从名称上来说,正则表达式应当是对应于正则语言的,在形式语言领域内所称的正则表达式确实如此。不过,在实际的编程语言中,很多正则表达式已经通过引入复杂的扩展,可以匹配正则表达式所不能描述的内容。形式语言中的正则表达式和一般编程语言中所称的正则表达式在语法上也有较大差异。直觉上来说,自动机消耗输入符号,并在自身的不同状态间转移,可以通过状态机消耗完整个字符串之后是否达到某些特定状态来定义一个字符串是否属于某一个语言。语言可以通过某种自动机来识别,比如图灵机、有限状态自动机。
相关
- 寄生虫寄生虫(英语:parasitic worm)指一种生物,将其一生的大多数时间居住在另外一种生物体内,且会危害被居住的生物体的生理机能,被寄居的生物则称为宿主或寄主。寄生虫会在宿主或寄主体
- 鼻内空气流通计鼻内空气流通计、鼻侧压测量法、鼻内压力测量计、鼻测压计、鼻阻力测量(英文:Rhinomanometry)是一种气体压力计(英语:manometry),用来测量鼻腔内的空气流通量。 鼻内空气流通计能客
- CCR5n/an/an/an/an/an/an/an/an/an/aCCR5(C-C chemokine receptor type 5),中文名:趋化因子受体5或趋化因子C-C亚族受体5,也称为CD195。是白细胞表面的一种蛋白质,因此也称为CCR5蛋白质
- 金孢菌寄生Hypolyssus chrysospermus (Tul. & C.Tul.) Kuntze (1898) Apiocrea chrysosperma (Tul. & C.Tul.) Syd. & P.Syd. (1921)金孢菌寄生(学名:Hypomyces chrysospermus),俗称牛肝菌
- H10N7H10N7是一种甲型流感病毒(有时称为禽流感)的亚种。在2004年,埃及首次爆发有人类感染的H10N7疫症。此次爆发感染了一些伊斯梅利亚的居民,包括两个一岁的婴儿和有一个孩子的家禽商
- 得克萨斯州得克萨斯州(英语:State of Texas,/ˈtɛksəs/,当地 /ˈtɛksɪz/),简称得州或德州,是全美国土地面积和人口的第二大州(面积仅次于阿拉斯加州;人口次于加利福尼亚州)。得克萨斯州位于
- 儿童早期幼儿也称为幼童,是人类发展的阶段之一。可能包括学步期(英语:toddlerhood)及之后,一直到学龄前的一段时间,此一阶段也常称为是玩耍期(Play age);是儿童阶段中较前期的部分。在心理学
- 萨摩斯岛萨摩斯岛(Σάμος),是希腊第9大岛屿,位于北爱琴、希俄斯岛以南,帕特莫斯岛和多德卡尼斯以北,东临安纳托利亚海岸。该岛面积478平方千米,岛上人口33,814人,是第9多人居住的岛屿,首
- 存在存在(英语:Existence),又译为实在、存有,是一个哲学概念,按照20世纪西方存在主义哲学家的定义,是具有难以改变,但能够改变的特性。而相对于存在的不存在(虚无)则是具有难以控制,但能够
- 毛细管毛细现象(又称毛细管作用)是指液体在细管状物体内侧,由液体与物体之间的附着力和因内聚力而产生的表面张力组合而成,令液体在不需施加外力的情况下,流向细管状物体的现象,该现象甚
