词组结构规则

✍ dations ◷ 2025-03-05 09:46:09 #词组结构规则

词组结构规则(Phrase structure rules),又称为短语结构规则、词组结构律,是一种用于描述特定语言句法的重写规则,与诺姆·乔姆斯基在1957年提出的早期阶段的转换文法密切相关。词组结构规则被用于将自然语言的句子分解成其构成部分,构成部分也被称为句法范畴(英语:Syntactic category),包括词汇范畴(lexical categories,词类)和词组范畴(phrasal categories)。常用的词组结构规则是根据成分关系(constituency relation)关系来操作,因此采用词组结构规则的文法是一种成分文法(英语:Phrase structure grammar),与基于依存关系(dependency relation)的依存文法(英语:Dependency grammar)形成对比。

词组结构规则通常具有以下形式:

意思是成分 A {displaystyle A} 被分成两个子成分 B {displaystyle B} C {displaystyle C} ,下面是一些英语的例子:

第一条规则:S(句子)是由一个NP(名词词组(英语:Noun phrase))后面接一个VP(动词词组)组成。

第二条规则:名词词组是由一个不定的Det(限定词)接一个N(名词)。

第三条规则:N(名词)前面可以有一个不定的AP(形容词词组(英语:adjective phrase)),后面可以接一个不定的 PP(介词词组(英语:repositional phrase))。圆括号表示不定的成分。

以句子符号S开头,并依次应用词组结构规则,最后应用取代性规则(Replacement Rules),将抽象符号换成实际词汇,可以生成许多正确的英语句子(或是由规则指定的任何语言)。如果规则是正确的,那么以这种方式产生的任何句子在文法(句法)上都应该正确。还可以预期这些规则将生成文法正确但无语义的句子,如以下的著名例子:

这句话是乔姆斯基构思的,用来说明词组结构规则能够生成句法正确但语义不正确的句子。词组结构规则将句子分解成它们的局部成分。这些成分通常表示为树结构(树状图)。乔姆斯基的句子可呈现如下:

Colorless green ideas sleep furiously.

成分是由单个节点所支配的任一词汇或词汇组合。因此,每个单独词汇都是一个成分。此外,主词NP“Colorless green ideas”、次要的NP“green ideas”和 VP“sleep furiously”也都是成分。词组结构规则和与其相关的树结构是直接成分分析(英语:Immediate constituent analysis)的一种形式。

在转换文法中,词组结构规则的系统由转换规则补充,转换规则会根据现有的句法结构产生新的句法结构(执行诸如否定化(英语:Affirmation and negation)、被动化等操作。)。这些转换并不是严格意义上的生成所需要的,因为它们产生的句子可以由一个适当扩展的词组结构规则系统单独生成,但是转换提供了更大的经济性,并使句子之间的重要关系能够反映在文法中。

词组结构规则的其中一个重要特色是以自上而下的方式检视句子结构。箭号左边的类别是大成分,在箭号右边的直接成分则是小成分。随着在给定句子的词组结构规则列表中向下移动,成分会被依次分解为其组成部分。这种自上而下的句子结构观点与许多现代理论句法学中的工作形成鲜明对比。举例来说,句子结构在最简方案中是自下而上生成的,其操作“合并”会将小成分合并为大成分,直到最大成分(即句子)形成为止。在这方面,理论句法学在很早之前就已放弃词组结构规则,但词组结构规则在计算语言学中似乎仍有其重要性。

常用的词组结构规则导致一个观点,认为句子结构是“基于成分的”。因此,采用词组结构规则的文法是“成分文法”(=词组结构文法(英语:Phrase structure grammar)),这与依存文法(英语:Dependency grammar)截然不同,依存文法将句子结构视为“基于依存的”。这意味着要使词组结构规则完全适用,就必须去理解基于成分的句子结构。成分关系是一对一或一对多的对应关系。句子中的每个词汇,在句法结构中至少会有一个节点与该词相对应。相比之下,依存关系是一对一的关系;句子中的每个词汇在句法结构中只会有一个节点与该词对应。下面的树说明了这种区别:

左边的成分树可以由词组结构规则生成。句子S被分解成越来越小的组成部分。相比之下,右边的依存树则无法由词组结构规则生成(至少不是按照一般解释方式)

一些文法的表征词组结构理论从未认可词组结构规则,而是以基模的角度来理解句子结构。这里的词组结构并非从词汇结合的规则中派生而来,而是源自句法基模或句法结构的规范或实例化,所表达的语义内容经常与在句中出现的特定词汇无关。这种方法本质上相当于一个词组结构规则与非组构语义理论相结合的系统,因为基于重写规则的文法形式的效力通常等同于基于基模替换的文法形式。

因此,句子“ Colorless green ideas sleep furiously”在这种方法中,不是从多个词组结构规则的应用中产生,而是将词汇填入具有以下结构的基模插槽中来生成:

表达了以下概念内容:

尽管它们非由成分组合,但这种模型具有单调性。此方法在构造文法(英语:construction grammar) 中高度发展,并且对中心语驱动词组结构文法(英语:Head-driven phrase structure grammar)和词汇功能文法(英语:Lexical functional grammar) 造成一定的影响,后两者显然被定性为词组结构文法。

 

相关

  • 赵武灵王赵武灵王(前340年-前295年),嬴姓,赵氏,名雍,中国战国中后期赵国的君主。死后谥号武灵。生于赵肃侯十年(前340年),在位共27年(前325至前299年),推行“胡服骑射”政策,赵国因而得以强盛,灭中
  • 河谷谷、谷地,由两侧正地形夹峙的狭长负地形,常有坡面径流、河流、湖泊发育,陡峻的谷地可能有泥石流,在等高线地形图上表现为一组向高处突出的等高线。也称“裂谷”,当地球板块拉开时
  • 水电站世界水电站列表列出了目前世界上装机容量在2 GW (吉瓦) 以上的水电站。位于中国湖北省的三峡水电站,是世界上最大的水电站,总装机容量为22.50 GW;位于巴西和巴拉圭的伊泰普水电
  • 逆伦命案逆伦命案又名伦常命案、逆伦惨案,逆伦是指违背伦常,杀害自己家族成员的事件,例如弑父母及杀夫、杀妻;谋害子女等。“杀”字无分尊卑,如“杀父”命案。但“弑”在汉语中,指杀害尊长
  • 2007–082007-08赛季是NBA第62个赛季。常规赛从2007年10月28日持续到2008年4月16日。在季后赛中,波士顿凯尔特人4:2战胜洛杉矶湖人获得总冠军。
  • 弧后盆地弧后盆地(Back-arc basins)是属于隐没系统中的地质构造单元。弧后盆地即在隐没带,坐落于火山弧后面的盆地,即称之。弧后盆地最广为讨论的应属分布在西太平洋一系列的弧后盆地,如:
  • 核心危机 -最终幻想VII-《核心危机 -最终幻想VII-》(日语:クライシス コア -ファイナルファンタジーVII-,英语:Crisis Core: Final Fantasy VII)是史克威尔开发并发行于PlayStation Portable平台上的动
  • 花轮英司花轮英司(7月6日-)是出身于日本山梨县的男性声优,隶属Kenyu Office事务所。1999年2000年2001年2002年2003年2004年2005年2006年2007年2008年2009年2010年2011年2012年2013年2014
  • 李碧华李碧华指的是下列之一的人:
  • 新巴比伦帝国新巴比伦帝国(英语:Neo-Babylonian Empire或者Second Babylonian Empire,前626年-前539年)又称为加尔底亚帝国,由迦勒底人所建,大约处于古代美索不达米亚南部。公元前626年建立,在尼布甲尼撒二世统治时国势达到鼎峰,最后在公元前539年被波斯人消灭。幼发拉底河 · 底格里斯河乌鲁克 · 乌尔 · 埃利都启什 · 拉格什 · 尼普尔阿卡德帝国 · 库提乌尔第三王朝 · 伊辛第一王朝 · 拉尔萨 · 伊辛第二王朝古巴比伦王国 · 克喜特 · 阿摩利埃兰 · 米坦尼