扩充巴科斯范式

✍ dations ◷ 2025-12-08 17:37:44 #扩充巴科斯范式

在计算机科学中,扩充巴科斯-瑙尔范式(ABNF)是一种基于巴科斯-瑙尔范式(BNF)的元语言,但它有自己的语法和派生规则。ABNF的原动原则是描述一种作为双向通信协议的语言的形式系统。它是由 (页面存档备份,存于互联网档案馆)("STD 68",大小写样式按照原文)定义的,也就是RFC 5234,经常用于互联网工程任务组(IETF)通信协议的定义语言。

RFC 5234取代了RFC 4234 (取代了RFC 2234).

一个ABNF规范是一些推导规则的集合,书写为:

规则 = 定义;注释CR LF

其中:

规则名字是不区分大小写的: <rulename>, <Rulename>, <RULENAME><rUlENamE>都指的是同一个规则。规则名字由一个字母以及后续的多个字母、数字和连字符(减号)组成。

用尖括号(“<”,“>”)包围规则名并不是必需的(如同它们在BNF里那样),但是它们可以用来在散文中界定规则名,以方便识别出规则名。

最终值由一个或多个数值字符指定。

数值字符可按下面的方式指定:先是一个百分号“%”,紧跟着基数(b = 二进制, d = 十进制, x = 十六进制),再其后是这个数值或数值串(用“.”来指示串联)。例如:“回车”可以用十进制的%d13或十六进制的%x0D来指定,而“回车换行”则可以用%d13.10来指定。

字面文本是通过包含在在双引号(")中字符串来指定的。这些字符串是不区分大小写的,使用的字符集是(US-)ASCII。所以字符串“abc”将匹配“abc”,“Abc”,“aBc”,“abC”,“ABc”,“AbC”,“aBC”和“ABC”。对于区分大小写的匹配,必须定义明确的字符,例如:若要匹配“aBc”,定义必须是%d97 %d66 %d99

空白字符被用来分隔定义中的各个元素:要使空格被识别为分割符则必须明确的包含它。

规则1规则2

规则可以通过列出一系列的规则名来定义。

要匹配字符串“aba”可以使用下列规则:

规则1 / 规则2

一个规则可以通过用斜杠(“/”)分隔的可供选择的子规则列表来定义。

要接受规则<foo>或规则<bar>可构造如下规则:

规则1 =/ 规则2

可以通过在和之间使用“=/”来向一个规则增加补充选择。

规则

等价于

%c##-##

数值范围可以通过使用连字符(“-”)来指定。

规则

等价于

(规则1规则2)

在中,元素可以放置在圆括号中来将组合起来,该组合视为单个元素。

要匹配“elem foobar snafoo”或“elem tarfoo snafoo”可以构造下列规则:

要匹配“elem foobar”或“tarfoo snafoo”可以构造下列规则:

元素前面的星号*表示重复,其完整形式是:

m*n规则

要表示一个元素的重复,就要使用<m>*<n>元素形式。可选的<m>给出要包含的元素的最小数目,默认为0;可选的<n>给出要包含的元素的最大数目,默认为无穷大。

例子:

n规则

要表示特定数目的元素可使用形式<n>元素,相当于用不定量重复形式表示的<n>*<n>元素

使用2DIGIT得到两个数字,使用3DIGIT得到三个数字。(DIGIT在下面的核心规则中定义,也见例子中的)。

要表示可选元素,下列构造是等价的:

;注释

注释从一个分号(“;”)开始,并持续到此行的结束。

下面的操作符给出了从高(结合最紧密)到低(结合最松散)的优先级:

操作符与一起使用会造成混淆,因此建议使用来确保串联组的明确。

例如:

我们 = 你 我/他 她

会产生下面两种歧义:

所以,使用来确保不会产生歧义:

(你 我)/(他 她)

核心规则

核心规则定义于ABNF标准中。

在巴科斯范式(BNF)条目中的邮政地址的例子可以被指定为:

postal-address = name-part street zip-partname-part = *(personal-part SP) last-name  CRLFname-part = / personal-part CRLFpersonal-part = first-name / (initial ".")first-name = *ALPHAinitial = ALPHAlast-name = *ALPHAsuffix = ("Jr." / "Sr." / 1*("I" / "V" / "X"))street =  house-num SP street-name CRLFapt = 1*4DIGIThouse-num = 1*8(DIGIT / ALPHA)street-name = 1*VCHARzip-part = town-name "," SP state 1*2SP zip-code CRLFtown-name = 1*(ALPHA / SP)state = 2ALPHAzip-code = 5DIGIT 

RFC 5234 (页面存档备份,存于互联网档案馆)加入了一条结合LWSP的警告,如下:

若使用该直线空白规则,将允许存在只包含空白字符的行,而这样的行在邮件头中已不再合法,并且已在其他环境中导致了互操作问题。不要在定义邮件头时使用它,在其他环境下使用时也要格外注意。

相关

  • 日本国家女子足球队中华台北 1 – 0 日本 (日本 21 – 0 关岛 (美国 9 – 0 日本 (日本国家女子足球队是日本的女子足球代表队,新进世界杯卫冕冠军,亚洲最具实力的国家女子足球队之一,由日
  • 胖吉猫胖吉猫(英语:Pusheen)又称胖吉喵,是美国插画师克莱儿.贝尔顿(英语:Claire Belton)根据她领养的猫咪(现在与克莱儿(英语:Claire Belton)的父母生活在一起)所设计出的角色,是一只灰色大花猫,
  • 贝雅士蓄水池上段贝雅士蓄水池上段(英语:Upper Peirce Reservoir)是新加坡的第四个水库。自皮尔斯水库上段公园可俯瞰此处。它起初为加冷河水库,1910年,新加坡的第二个水库于加冷河下游建成。1922
  • 罗塞塔山坐标:45°53′14″N 7°40′52″E / 45.8873°N 7.6812°E / 45.8873; 7.6812罗塞塔山(意大利语:Monte Roisetta),是意大利的山峰,位于该国西北部,由瓦莱达奥斯塔大区负责管辖,属于
  • 黎族黎族是中国南方少数民族,列中国大陆第18大民族。海南是黎族世居地,除海南以外,现代黎族聚居区分布于中国大陆贵州、广东、广西和江西等省区。根据2000年人口普查,中华地区黎族人
  • 咬住 (北元)咬住,元朝、北元大臣,蒙古族人。至正二十七年(1367年)八月,以左司员外郎咬住、枢密参议王弘远为经历。次年,明朝北伐,咬住随元顺帝北徙。洪武二十一年(1388年),北元大汗脱古思帖木儿移
  • 乍得盆地乍得盆地是非洲中北部一个巨大的内陆盆地,地跨乍得、尼日尔、尼日利亚和中非共和国等国家,盆地内有非洲大陆最大的内陆水系。盆地内为粘土和沙质沉积物,周边为山地。北部有提贝
  • 2011年凯尔特杯2011年凯尔特国家杯是第一届由爱尔兰、北爱尔兰、苏格兰和威尔士的国家队或代表队参赛的循环制足球赛。第1轮2场比赛于2011年2月在都柏林进行,其余4场比赛随后于5月进行。爱
  • 渡部建渡部建(英语:Ken Watabe, 1972年9月23日-)是一位日本主持人,搞笑艺人。1972年出生于东京都八王子市,毕业于神奈川大学经济系,1993年和同届学生儿嶋一哉组成搞笑艺人组合UNJASH。所属经纪公司是人力舍制作。2017年4月宣布和日本女星佐佐木希结婚,两人育有一子。2020年6月被爆出和多名女性出轨。
  • 七死八活七死八活是围棋里的一个术语,是死活中的常见棋形,七和八指的是在二路连成直线的棋子数。如果在周围被围死的情况下,七子是先手活、后手死,八子可以后手活。但是,该术语并不适用于所有情况。当该条直线最边缘的棋子处在棋盘的一线时,即使只有七子连成直线也是先手活。图一中的黑棋只有七子,最后还原成直三,没办法后手活。注意,黑下A位没有用,白可下1位扑、破眼。图二,黑棋改变下法,最后还是还原成直三,没办法后手活。图三,黑棋先手活,最后成为直四。