扩展巴科斯范式
✍ dations ◷ 2025-08-02 21:27:36 #扩展巴科斯范式
扩展巴科斯-瑙尔范式(EBNF, Extended Backus–Naur Form)是表达作为描述计算机编程语言和形式语言的正规方式的上下文无关文法的元语法(metalanguage)符号表示法。它是基本巴科斯范式(BNF)元语法符号表示法的一种扩展。
它最初由尼克劳斯·维尔特开发,最常用的 EBNF 变体由标准,特别是 ISO-14977 所定义。
扩展巴科斯范式是一种表达形式语言文法的代码,如由终结符即可视字符、数字、标点符号、空白字符等组成的计算机程序的源代码。
EBNF 定义了把各符号序列分别指派到非终结符的产生规则:
digit excluding zero = "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9" ;digit = "0" | digit excluding zero ;
这个产生规则定义了在这个指派的左端的非终结符 。竖杠表示可供选择,而终结符被引号包围,最后跟着分号作为终止字符。所以 是一个 " 或可以是 " 或 或 直到 的一个 。
产生规则还可以包括由逗号分隔的一序列终结符或非终结符:
twelve = "1" , "2" ;two hundred one = "2" , "0" , "1" ;three hundred twelve = "3" , twelve ;twelve thousand two hundred one = twelve , two hundred one ;
可以省略或重复的表达式可以通过花括号 { ... } 表示:
natural number = digit excluding zero , { digit } ;
在这种情况下,字符串 , , ...,,...,,... 都是正确的表达式。要表示这种情况,于花括号内设立的所有东西可以重复任何次,包括根本不出现。
可选项可以通过方括号 表示:
integer = "0" | , natural number ;
所以 integer 是一个零()或可能前导可选的负号的一个自然数。
EBNF 还包括描述指定次数的重复,和排除产生式的某部分或向 EBNF 文法插入注释的语法。
1. 使用了如下约定:
2. 表示扩展 BNF 的每个操作符的正常字符和它所蕴涵的优先级(顶部为最高优先级)为:
* repetition-symbol- except-symbol, concatenate-symbol| definition-separator-symbol= defining-symbol; terminator-symbol
3. 下列括号对超越正常优先级:
´ first-quote-symbol first-quote-symbol ´" second-quote-symbol second-quote-symbol "(* start-comment-symbol end-comment-symbol *)( start-group-symbol end-group-symbol ){ start-repeat-symbol end-repeat-symbol }? special-sequence-symbol special-sequence-symbol ?
作为例子,下列语法规则展示了表达重复的设施:
aa = "A";bb = 3 * aa, "B";cc = 3 * , "C";dd = {aa}, "D";ee = aa, {aa}, "E";ff = 3 * aa, 3 * , "F";gg = {3 * aa}, "D";
这些规则定义的终结字符串如下:
aa: Abb: AAABcc: C AC AAC AAACdd: D AD AAD AAAD AAAAD etc.ee: AE AAE AAAE AAAAE AAAAAE etc.ff: AAAF AAAAF AAAAAF AAAAAAFgg: D AAAD AAAAAAD etc.
示例
只允许赋值的简单编程语言可以用 EBNF 定义为:
(* a simple program in EBNF − Wikipedia *) program = 'PROGRAM' , white space , identifier , white space , 'BEGIN' , white space , { assignment , ";" , white space } , 'END.' ; identifier = alphabetic character , ; number = , digit , ; string = '"' , { all characters − '"' } , '"' ; assignment = identifier , ":=" , ( number | identifier | string ) ; alphabetic character = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" | "J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" | "S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z" ; digit = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9" ; white space = ? white space characters ? ; all characters = ? all visible characters ? ;
一个语法上正确的程序:
PROGRAM DEMO1 BEGIN A0:=3; B:=45; H:=-100023; C:=A; D123:=B34A; BABOON:=GIRAFFE; TEXT:="Hello world!"; END.
这个语言可以轻易的扩展上控制流,算术表达式和输入/输出指令。就可以开发出一个小的、可用的编程语言了。
BNF 有着可选项和重复不能直接表达的问题。作为替代,它们需要利用中介规则或两选一规则,对于可选项,定义要么是空的要么是可选的产生式的规则,对于重复,递归的定义要么是被重复的产生式要么是自身的规则。同样的构造仍可用在 EBNF 中。
可选项:
signed number = number ;
可按 BNF-风格定义为:
signed number = sign , number | number ;
或
signed number = optional sign , number ;optional sign , = ε | sign , ; (* 使用 ε 来更清晰的指示空产生式 *)
重复:
number = { digit } digit ;
可按 BNF-风格定义为:
number = digit | number digit;
EBNF 较 BNF 的优点
EBNF 排除了 BNF 的一些缺陷:
EBNF 解决了这些问题:
进一步还提供了定义重复次数,排除法选择(比如除了引号的所有字符)和注释等的增强机制。
不管所有这些增强,EBNF 在能定义的语言的意义上不比 BNF 更强大。在原理上用 EBNF 定义的任何文法都可以用 BNF 表达。但是经常导致可观的更多规则的表示。
EBNF 已经被ISO用代码 标准化了。
在某些场合任何扩展的 BNF 都被称为 EBNF。例如 W3C 使用 EBNF 来规定 XML。
依据 ISO 14977 标准,提供了两个设施来扩展 EBNF。其一是在 EBNF 文法部分的特殊序列,它是在问号包围内的任意文本,其解释超出了 EBNF 标准的范围。例如,空格字符可以用如下规则定义:
space = ? US-ASCII character 32 ?;
其二利用圆括号在 EBNF 中不能放置到紧随标识符之后的事实。下列不是有效的 EBNF:
something = foo ( bar );
所以 EBNF 的扩展可以使用这种表示法。例如,在 Lisp 文法中,函数应用可以用如下规则定义:
function application = list( symbol , );
有关工作
- W3C 使用一种不同的 EBNF 来指定 XML 语法。
- British Standards Institute 在1981年出版了一个 EBNF 标准: BS 6154。
- IETF 使用在 RFC 4234 中规定的扩充 BNF (ABNF)。
参见
- 扩充巴科斯范式
- 巴科斯范式
- 正则表达式
- Spirit Parser Framework
- Wirth Syntax Notation
引用
- Niklaus Wirth: What can we do about the unnecessary diversity of notation for syntactic definitions? (页面存档备份,存于互联网档案馆) CACM, Vol. 20, Issue 11, November 1977, pp. 822-823.
- Roger S. Scowen: Extended BNF — A generic base standard. Software Engineering Standards Symposium 1993.
- The International standard (ISO 14977 (页面存档备份,存于互联网档案馆)) that defines the EBNF is now freely available as zipped pdf file (页面存档备份,存于互联网档案馆).
外部链接
- Article "EBNF: A Notation to Describe Syntax (PDF) (页面存档备份,存于互联网档案馆)" by Richard E. Pattis describing the functions and syntax of EBNF
- Article "BNF and EBNF: What are they and how do they work? (页面存档备份,存于互联网档案馆)" by Lars Marius Garshol
- Article "The Naming of Parts (页面存档备份,存于互联网档案馆)" by John E. Simpson
- ISO/IEC 14977 : 1996(E) (页面存档备份,存于互联网档案馆)
- RFC 4234 - Augmented BNF for Syntax Specifications: ABNF
- BNF/EBNF variants (页面存档备份,存于互联网档案馆) - a table by Pete Jinks comparing several syntaxes.
- Create syntax diagrams from EBNF
本条目部分或全部内容出自以GFDL授权发布的《自由线上电脑词典》(FOLDOC)。
相关
- 尿床夜遗尿(英语:Nocturnal enuresis),俗称尿床,部分地区也叫做攋尿(讹写作“濑尿”,“攋”是撒、遗、弃的意思),是指五岁或以上的儿童,于睡眠时不自觉的排尿现象。这是一个在儿童期很常见
- 电源管理电源管理是某些电器的功能,尤其是计算机(包括CPU、GPU)和计算机外部设备(例如显示器和打印机),在不使用时会关闭电源或将系统切换到低功耗状态。 在计算机中,这称为PC电源管理,它是
- 杨实杨实(?-?),字真卿,是第五任播州土司,其活跃年代位于五代末年至北宋初年。杨实是第四代土司杨三公的次子。杨三公死后,杨实的长兄杨宝应该继承土司之位。但杨宝自认为才能不如杨实,遂让
- 饭田舞饭田舞(日文:飯田 舞,英文:Mai Iida, 1984年6月19日-)是日本的创作歌手,主要在关东地区演出 。神奈川县 茅崎市出身。身高150cm、血型 O型。个性随兴。认为自己的缺点是“情绪化很
- 塞德里克·鲍尔塞德里克·格伦·鲍尔(英语:Cedric Glenn Ball,1968年4月16日-),为美国NBA联盟的前职业篮球运动员。
- 范师孟范师孟(越南语:Phạm Sư Mạnh/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H","M
- 安娜·蒙格拉丝安娜·蒙格拉丝(Anna Mouglalis,1978年4月26日-),法国名模及演员,出生于法国大西洋卢瓦尔省,其父是希腊人,母为法国人,毕业于法国音乐表演艺术学院。她是香奈儿专用模特儿。莫拉莉于
- 花花小梅《花花小梅》(花やか梅ちゃん)是师走冬子的四格漫画作品。自2003年7月号开始在《まんがタウンオリジナル》连载至2006年9月号(最终号),杂志停刊后转移到《まんがタウン》连载,自20
- 凯文·吴凯文·吴(朝鲜语:케빈 오,英语:Kevin Oh,1990年8月29日-),是韩裔美国创作歌手,参加韩国Mnet电视台选秀节目《Superstar K7》获得冠军,在2016年发行首张单曲《昨天今天明天》(어제 오늘 내일)正式出道。2019年参加JTBC电视台节目《Super Band》后,兼任乐团After Moon的主唱和吉他手。凯文·吴是出生于美国纽约的韩裔歌手,毕业于常春藤盟校的达特茅斯学院。2015年到韩国参加Mnet电视台选秀节目《Superstar K7》获得冠军后,和CJ E&M签约成
- 新闻30分《新闻30分》(英语:News 30')是中国中央电视台综合频道和新闻频道每天午间播出的正午新闻节目。前身为1984年1月1日开播的《午间新闻》。1995年,中央电视台提出“巩固提高两头,发展中间”的新闻节目播出策略,在已有的早晚间新闻黄金时段大力发展午间新闻时段。1995年4月3日,由《午间新闻》改版而成、执行“采编播合一,人财物独立”的特殊政策的《新闻30分》在CCTV-1首播,并于每天的14:30至15:00在CCTV-2重播。2003年5月1日,中国中央电视台新闻频道开播,《新闻30分》开始在中央