扩充巴科斯范式

✍ dations ◷ 2025-12-07 04:01:28 #扩充巴科斯范式

在计算机科学中,扩充巴科斯-瑙尔范式(ABNF)是一种基于巴科斯-瑙尔范式(BNF)的元语言,但它有自己的语法和派生规则。ABNF的原动原则是描述一种作为双向通信协议的语言的形式系统。它是由 (页面存档备份,存于互联网档案馆)("STD 68",大小写样式按照原文)定义的,也就是RFC 5234,经常用于互联网工程任务组(IETF)通信协议的定义语言。

RFC 5234取代了RFC 4234 (取代了RFC 2234).

一个ABNF规范是一些推导规则的集合,书写为:

规则 = 定义;注释CR LF

其中:

规则名字是不区分大小写的: <rulename>, <Rulename>, <RULENAME><rUlENamE>都指的是同一个规则。规则名字由一个字母以及后续的多个字母、数字和连字符(减号)组成。

用尖括号(“<”,“>”)包围规则名并不是必需的(如同它们在BNF里那样),但是它们可以用来在散文中界定规则名,以方便识别出规则名。

最终值由一个或多个数值字符指定。

数值字符可按下面的方式指定:先是一个百分号“%”,紧跟着基数(b = 二进制, d = 十进制, x = 十六进制),再其后是这个数值或数值串(用“.”来指示串联)。例如:“回车”可以用十进制的%d13或十六进制的%x0D来指定,而“回车换行”则可以用%d13.10来指定。

字面文本是通过包含在在双引号(")中字符串来指定的。这些字符串是不区分大小写的,使用的字符集是(US-)ASCII。所以字符串“abc”将匹配“abc”,“Abc”,“aBc”,“abC”,“ABc”,“AbC”,“aBC”和“ABC”。对于区分大小写的匹配,必须定义明确的字符,例如:若要匹配“aBc”,定义必须是%d97 %d66 %d99

空白字符被用来分隔定义中的各个元素:要使空格被识别为分割符则必须明确的包含它。

规则1规则2

规则可以通过列出一系列的规则名来定义。

要匹配字符串“aba”可以使用下列规则:

规则1 / 规则2

一个规则可以通过用斜杠(“/”)分隔的可供选择的子规则列表来定义。

要接受规则<foo>或规则<bar>可构造如下规则:

规则1 =/ 规则2

可以通过在和之间使用“=/”来向一个规则增加补充选择。

规则

等价于

%c##-##

数值范围可以通过使用连字符(“-”)来指定。

规则

等价于

(规则1规则2)

在中,元素可以放置在圆括号中来将组合起来,该组合视为单个元素。

要匹配“elem foobar snafoo”或“elem tarfoo snafoo”可以构造下列规则:

要匹配“elem foobar”或“tarfoo snafoo”可以构造下列规则:

元素前面的星号*表示重复,其完整形式是:

m*n规则

要表示一个元素的重复,就要使用<m>*<n>元素形式。可选的<m>给出要包含的元素的最小数目,默认为0;可选的<n>给出要包含的元素的最大数目,默认为无穷大。

例子:

n规则

要表示特定数目的元素可使用形式<n>元素,相当于用不定量重复形式表示的<n>*<n>元素

使用2DIGIT得到两个数字,使用3DIGIT得到三个数字。(DIGIT在下面的核心规则中定义,也见例子中的)。

要表示可选元素,下列构造是等价的:

;注释

注释从一个分号(“;”)开始,并持续到此行的结束。

下面的操作符给出了从高(结合最紧密)到低(结合最松散)的优先级:

操作符与一起使用会造成混淆,因此建议使用来确保串联组的明确。

例如:

我们 = 你 我/他 她

会产生下面两种歧义:

所以,使用来确保不会产生歧义:

(你 我)/(他 她)

核心规则

核心规则定义于ABNF标准中。

在巴科斯范式(BNF)条目中的邮政地址的例子可以被指定为:

postal-address = name-part street zip-partname-part = *(personal-part SP) last-name  CRLFname-part = / personal-part CRLFpersonal-part = first-name / (initial ".")first-name = *ALPHAinitial = ALPHAlast-name = *ALPHAsuffix = ("Jr." / "Sr." / 1*("I" / "V" / "X"))street =  house-num SP street-name CRLFapt = 1*4DIGIThouse-num = 1*8(DIGIT / ALPHA)street-name = 1*VCHARzip-part = town-name "," SP state 1*2SP zip-code CRLFtown-name = 1*(ALPHA / SP)state = 2ALPHAzip-code = 5DIGIT 

RFC 5234 (页面存档备份,存于互联网档案馆)加入了一条结合LWSP的警告,如下:

若使用该直线空白规则,将允许存在只包含空白字符的行,而这样的行在邮件头中已不再合法,并且已在其他环境中导致了互操作问题。不要在定义邮件头时使用它,在其他环境下使用时也要格外注意。

相关

  • 介词悬空介词悬空(Preposition stranding,英语有时又作P-stranding)是一种语法上的结构,在其中,带有受词的介词出现在与其支配的受词直接相连的地方之外的地方(也就是说介词“悬”在了
  • 教皇教宗(拉丁语:Papa),或译教皇(华语圈外国家如韩国、日本、越南与部分教外人士目前仍沿用之),是罗马主教,同时为普世天主教会领袖与梵蒂冈城国国家元首,传统上被认为是圣伯多禄宗徒之位
  • 猫斗猫斗 (catfight) 是用于描述两位女性之间打斗,通常以抓、掌掴、拳击、拉扯头发以及撕裂服饰做为特征。 它也可以用于形容女性之间的口头侮辱,或者为了争夺男性、权力或专业成
  • 冀元亨冀元亨(1482年-1521年),字惟乾,湖广常德府武陵县(今湖南省常德市)人。明朝政治人物。正德十一年(1516年),冀元亨乡试中举,其一直跟随从学王守仁。朱宸濠曾经为其所学所服,并厚赠遣送,冀元
  • 欧莎·叶克斯托姆欧莎·叶克斯托姆(瑞典语:Åsa Ekström;1983年10月10日-),是在日本活动的瑞典漫画家和插画家,女性,目前居住于东京都杉并区。1983年,欧莎·叶克斯托姆出生于瑞典布莱金厄地区的卡尔
  • 朱利叶斯·佩特森朱利叶斯·彼得·克里斯蒂安·彼得森(Julius Peter Christian Petersen,1839年6月16日-1910年8月5日),丹麦数学家。他在图论的早期研究中做出了重要贡献。1892年,他创造出了一个图
  • 华晓丽华晓丽(1972年12月-),重庆人,汉族,中国共产党党员‎。中华人民共和国政治人物、第十三届全国人民代表大会重庆市代表。2018年,华晓丽被选为重庆市出席第十三届全国人民代表大会代表。
  • 1月17日1月17日是公历(平年)年的第17天,离一年的结束还有348天(闰年是349天)。
  • 蒂娜·比堤蒂娜·比堤(Tina Beattie,1955年3月16日-)是英国的罗马天主教神学家, 作家和播音员。她是罗汉普顿大学天主教研究课程的教授,她的学术研究和出版主题,从依蕊格莱(Luce Irigaray)的象征主义及阴性书写角度分析早帮基督宗教及当代罗马天主教对玛利亚及夏娃的描述。包括神学、社会性别 和批判理论,圣母玛利亚的象征主义和流派,最近的研究包括自然法,人权和妇女权利,以及最近被称为新无神论(the new atheism)的反宗教运动。除了她的学术工作,她经常应邀 就有关的问题出席公开讲座,讨
  • 小泽秋成小泽秋成(おざわ しゅうせい,1886年-1954年),日本长野县人,画家。曾入选第5-7回台展西洋画部审查员,以台湾主题绘制风景画闻名。小泽秋成参加第五回台展的油画作品《台北风景一》与《台北风景二》,评论家大泽贞吉评论其使用东洋画线条笔法取代西方油画的块面涂抹,是西洋人所创作不出的“东洋艺术风格的油画”,对小泽秋成的画作赞誉有加。小泽秋成融合东西洋的绘画手法蔚为风潮,引起当时的年轻画家争相效仿,根据画家郑获义记述,因为他的审查员身份及名气,他在高雄居住于西子湾旅馆,有许多年轻画家会拿作品向他请教。