扩展巴科斯范式
✍ dations ◷ 2025-06-26 19:33:42 #扩展巴科斯范式
扩展巴科斯-瑙尔范式(EBNF, Extended Backus–Naur Form)是表达作为描述计算机编程语言和形式语言的正规方式的上下文无关文法的元语法(metalanguage)符号表示法。它是基本巴科斯范式(BNF)元语法符号表示法的一种扩展。
它最初由尼克劳斯·维尔特开发,最常用的 EBNF 变体由标准,特别是 ISO-14977 所定义。
扩展巴科斯范式是一种表达形式语言文法的代码,如由终结符即可视字符、数字、标点符号、空白字符等组成的计算机程序的源代码。
EBNF 定义了把各符号序列分别指派到非终结符的产生规则:
digit excluding zero = "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9" ;digit = "0" | digit excluding zero ;
这个产生规则定义了在这个指派的左端的非终结符 。竖杠表示可供选择,而终结符被引号包围,最后跟着分号作为终止字符。所以 是一个 " 或可以是 " 或 或 直到 的一个 。
产生规则还可以包括由逗号分隔的一序列终结符或非终结符:
twelve = "1" , "2" ;two hundred one = "2" , "0" , "1" ;three hundred twelve = "3" , twelve ;twelve thousand two hundred one = twelve , two hundred one ;
可以省略或重复的表达式可以通过花括号 { ... } 表示:
natural number = digit excluding zero , { digit } ;
在这种情况下,字符串 , , ...,,...,,... 都是正确的表达式。要表示这种情况,于花括号内设立的所有东西可以重复任何次,包括根本不出现。
可选项可以通过方括号 表示:
integer = "0" | , natural number ;
所以 integer 是一个零()或可能前导可选的负号的一个自然数。
EBNF 还包括描述指定次数的重复,和排除产生式的某部分或向 EBNF 文法插入注释的语法。
1. 使用了如下约定:
2. 表示扩展 BNF 的每个操作符的正常字符和它所蕴涵的优先级(顶部为最高优先级)为:
* repetition-symbol- except-symbol, concatenate-symbol| definition-separator-symbol= defining-symbol; terminator-symbol
3. 下列括号对超越正常优先级:
´ first-quote-symbol first-quote-symbol ´" second-quote-symbol second-quote-symbol "(* start-comment-symbol end-comment-symbol *)( start-group-symbol end-group-symbol ){ start-repeat-symbol end-repeat-symbol }? special-sequence-symbol special-sequence-symbol ?
作为例子,下列语法规则展示了表达重复的设施:
aa = "A";bb = 3 * aa, "B";cc = 3 * , "C";dd = {aa}, "D";ee = aa, {aa}, "E";ff = 3 * aa, 3 * , "F";gg = {3 * aa}, "D";
这些规则定义的终结字符串如下:
aa: Abb: AAABcc: C AC AAC AAACdd: D AD AAD AAAD AAAAD etc.ee: AE AAE AAAE AAAAE AAAAAE etc.ff: AAAF AAAAF AAAAAF AAAAAAFgg: D AAAD AAAAAAD etc.
示例
只允许赋值的简单编程语言可以用 EBNF 定义为:
(* a simple program in EBNF − Wikipedia *) program = 'PROGRAM' , white space , identifier , white space , 'BEGIN' , white space , { assignment , ";" , white space } , 'END.' ; identifier = alphabetic character , ; number = , digit , ; string = '"' , { all characters − '"' } , '"' ; assignment = identifier , ":=" , ( number | identifier | string ) ; alphabetic character = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" | "J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" | "S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z" ; digit = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9" ; white space = ? white space characters ? ; all characters = ? all visible characters ? ;
一个语法上正确的程序:
PROGRAM DEMO1 BEGIN A0:=3; B:=45; H:=-100023; C:=A; D123:=B34A; BABOON:=GIRAFFE; TEXT:="Hello world!"; END.
这个语言可以轻易的扩展上控制流,算术表达式和输入/输出指令。就可以开发出一个小的、可用的编程语言了。
BNF 有着可选项和重复不能直接表达的问题。作为替代,它们需要利用中介规则或两选一规则,对于可选项,定义要么是空的要么是可选的产生式的规则,对于重复,递归的定义要么是被重复的产生式要么是自身的规则。同样的构造仍可用在 EBNF 中。
可选项:
signed number = number ;
可按 BNF-风格定义为:
signed number = sign , number | number ;
或
signed number = optional sign , number ;optional sign , = ε | sign , ; (* 使用 ε 来更清晰的指示空产生式 *)
重复:
number = { digit } digit ;
可按 BNF-风格定义为:
number = digit | number digit;
EBNF 较 BNF 的优点
EBNF 排除了 BNF 的一些缺陷:
EBNF 解决了这些问题:
进一步还提供了定义重复次数,排除法选择(比如除了引号的所有字符)和注释等的增强机制。
不管所有这些增强,EBNF 在能定义的语言的意义上不比 BNF 更强大。在原理上用 EBNF 定义的任何文法都可以用 BNF 表达。但是经常导致可观的更多规则的表示。
EBNF 已经被ISO用代码 标准化了。
在某些场合任何扩展的 BNF 都被称为 EBNF。例如 W3C 使用 EBNF 来规定 XML。
依据 ISO 14977 标准,提供了两个设施来扩展 EBNF。其一是在 EBNF 文法部分的特殊序列,它是在问号包围内的任意文本,其解释超出了 EBNF 标准的范围。例如,空格字符可以用如下规则定义:
space = ? US-ASCII character 32 ?;
其二利用圆括号在 EBNF 中不能放置到紧随标识符之后的事实。下列不是有效的 EBNF:
something = foo ( bar );
所以 EBNF 的扩展可以使用这种表示法。例如,在 Lisp 文法中,函数应用可以用如下规则定义:
function application = list( symbol , );
有关工作
- W3C 使用一种不同的 EBNF 来指定 XML 语法。
- British Standards Institute 在1981年出版了一个 EBNF 标准: BS 6154。
- IETF 使用在 RFC 4234 中规定的扩充 BNF (ABNF)。
参见
- 扩充巴科斯范式
- 巴科斯范式
- 正则表达式
- Spirit Parser Framework
- Wirth Syntax Notation
引用
- Niklaus Wirth: What can we do about the unnecessary diversity of notation for syntactic definitions? (页面存档备份,存于互联网档案馆) CACM, Vol. 20, Issue 11, November 1977, pp. 822-823.
- Roger S. Scowen: Extended BNF — A generic base standard. Software Engineering Standards Symposium 1993.
- The International standard (ISO 14977 (页面存档备份,存于互联网档案馆)) that defines the EBNF is now freely available as zipped pdf file (页面存档备份,存于互联网档案馆).
外部链接
- Article "EBNF: A Notation to Describe Syntax (PDF) (页面存档备份,存于互联网档案馆)" by Richard E. Pattis describing the functions and syntax of EBNF
- Article "BNF and EBNF: What are they and how do they work? (页面存档备份,存于互联网档案馆)" by Lars Marius Garshol
- Article "The Naming of Parts (页面存档备份,存于互联网档案馆)" by John E. Simpson
- ISO/IEC 14977 : 1996(E) (页面存档备份,存于互联网档案馆)
- RFC 4234 - Augmented BNF for Syntax Specifications: ABNF
- BNF/EBNF variants (页面存档备份,存于互联网档案馆) - a table by Pete Jinks comparing several syntaxes.
- Create syntax diagrams from EBNF
本条目部分或全部内容出自以GFDL授权发布的《自由线上电脑词典》(FOLDOC)。
相关
- 磅士卑省磅士卑省(高棉语:ខេត្តកំពង់ស្ពឺ,罗马化:Khêt Kampong Speu,高棉语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Sego
- 八重之樱《八重之樱》(八重の桜)为NHK第52部大河剧,2013年1月6日起开始播出。由绫濑遥主演。原本该企划是完全与本次大河剧的播出无关,但是在2011年3月11日发生了东日本大震灾,NHK内部为
- 雪岳山国立公园雪岳山国立公园(朝鲜语:설악산국립공원/雪嶽山國立公園 Seoraksan Gungnip Gongwon */?)是位于韩国江原道束草市、襄阳郡、麟蹄郡、高城郡的山岳型国立公园。1970年3月24日与
- 尼古拉·什皮里奇尼古拉·什皮里奇(Dr. Nikola Špirić) (塞尔维亚语:Никола Шпирић) 1956年9月4日-) 波黑联邦塞族政治家。2007年到2012年任波黑部长会议主席(总理)。他在德瓦尔(Drva
- 大连开发区一中大连开发区一中,前名松岚高中,1985年7月27日建校,2001年迁至到大连金州新区大黑山脚下的新校舍。现任校长,党支部书记为孙兆礼。他人 责任 成就敢为国雄词:宋振镇 曲:刘潇骏
- 中说《中说》,是中国隋朝学者王通的语录,其子王福郊、王福畤模拟《论语》的体裁写成。因为王通的私谥为文中子,所以亦称《文中子》,十卷。内容是儒、道、佛三教调和的理论。提出儒、
- 第58届威尼斯影展第58届威尼斯影展(意大利语:58ª Mostra internazionale d'arte cinematografica di Venezia),于2001年8月23日至9月8日于意大利威尼斯举办,评审团主席则由意大利导演南尼·莫瑞
- 达伦·克里斯达伦·克里斯(英语:Darren Everett Criss,1987年2月5日-)是美国的演员、音乐人、作曲家。他曾参加过电视剧《欢乐合唱团》第二至五季的演出。出生于美国旧金山,从小就对于音乐以及
- 玛歌·冰咸玛歌·冰咸(Margot Bingham)是一名美国女演员和歌手。她最著名角色是在HBO电视剧《酒私风云》中饰演爵士乐歌手Daughter Maitland。2015年,冰咸开始于ABC电视剧《陌生血亲》中
- 曹天祐曹天祐(?-?),字有卿,江西饶州府浮梁县人,民籍,明朝政治人物。江西乡试第七十一名。嘉靖二十九年(1550年)庚戌科进士。官至云南按察使。曾祖曹邦仁;祖父曹璥,封知县;父曹煜,按察司佥事。嫡母李氏(封孺人);生母胡氏。