词组结构规则

✍ dations ◷ 2025-06-21 23:51:54 #词组结构规则

词组结构规则(Phrase structure rules),又称为短语结构规则、词组结构律,是一种用于描述特定语言句法的重写规则,与诺姆·乔姆斯基在1957年提出的早期阶段的转换文法密切相关。词组结构规则被用于将自然语言的句子分解成其构成部分,构成部分也被称为句法范畴(英语:Syntactic category),包括词汇范畴(lexical categories,词类)和词组范畴(phrasal categories)。常用的词组结构规则是根据成分关系(constituency relation)关系来操作,因此采用词组结构规则的文法是一种成分文法(英语:Phrase structure grammar),与基于依存关系(dependency relation)的依存文法(英语:Dependency grammar)形成对比。

词组结构规则通常具有以下形式:

意思是成分 A {displaystyle A} 被分成两个子成分 B {displaystyle B} C {displaystyle C} ,下面是一些英语的例子:

第一条规则:S(句子)是由一个NP(名词词组(英语:Noun phrase))后面接一个VP(动词词组)组成。

第二条规则:名词词组是由一个不定的Det(限定词)接一个N(名词)。

第三条规则:N(名词)前面可以有一个不定的AP(形容词词组(英语:adjective phrase)),后面可以接一个不定的 PP(介词词组(英语:repositional phrase))。圆括号表示不定的成分。

以句子符号S开头,并依次应用词组结构规则,最后应用取代性规则(Replacement Rules),将抽象符号换成实际词汇,可以生成许多正确的英语句子(或是由规则指定的任何语言)。如果规则是正确的,那么以这种方式产生的任何句子在文法(句法)上都应该正确。还可以预期这些规则将生成文法正确但无语义的句子,如以下的著名例子:

这句话是乔姆斯基构思的,用来说明词组结构规则能够生成句法正确但语义不正确的句子。词组结构规则将句子分解成它们的局部成分。这些成分通常表示为树结构(树状图)。乔姆斯基的句子可呈现如下:

Colorless green ideas sleep furiously.

成分是由单个节点所支配的任一词汇或词汇组合。因此,每个单独词汇都是一个成分。此外,主词NP“Colorless green ideas”、次要的NP“green ideas”和 VP“sleep furiously”也都是成分。词组结构规则和与其相关的树结构是直接成分分析(英语:Immediate constituent analysis)的一种形式。

在转换文法中,词组结构规则的系统由转换规则补充,转换规则会根据现有的句法结构产生新的句法结构(执行诸如否定化(英语:Affirmation and negation)、被动化等操作。)。这些转换并不是严格意义上的生成所需要的,因为它们产生的句子可以由一个适当扩展的词组结构规则系统单独生成,但是转换提供了更大的经济性,并使句子之间的重要关系能够反映在文法中。

词组结构规则的其中一个重要特色是以自上而下的方式检视句子结构。箭号左边的类别是大成分,在箭号右边的直接成分则是小成分。随着在给定句子的词组结构规则列表中向下移动,成分会被依次分解为其组成部分。这种自上而下的句子结构观点与许多现代理论句法学中的工作形成鲜明对比。举例来说,句子结构在最简方案中是自下而上生成的,其操作“合并”会将小成分合并为大成分,直到最大成分(即句子)形成为止。在这方面,理论句法学在很早之前就已放弃词组结构规则,但词组结构规则在计算语言学中似乎仍有其重要性。

常用的词组结构规则导致一个观点,认为句子结构是“基于成分的”。因此,采用词组结构规则的文法是“成分文法”(=词组结构文法(英语:Phrase structure grammar)),这与依存文法(英语:Dependency grammar)截然不同,依存文法将句子结构视为“基于依存的”。这意味着要使词组结构规则完全适用,就必须去理解基于成分的句子结构。成分关系是一对一或一对多的对应关系。句子中的每个词汇,在句法结构中至少会有一个节点与该词相对应。相比之下,依存关系是一对一的关系;句子中的每个词汇在句法结构中只会有一个节点与该词对应。下面的树说明了这种区别:

左边的成分树可以由词组结构规则生成。句子S被分解成越来越小的组成部分。相比之下,右边的依存树则无法由词组结构规则生成(至少不是按照一般解释方式)

一些文法的表征词组结构理论从未认可词组结构规则,而是以基模的角度来理解句子结构。这里的词组结构并非从词汇结合的规则中派生而来,而是源自句法基模或句法结构的规范或实例化,所表达的语义内容经常与在句中出现的特定词汇无关。这种方法本质上相当于一个词组结构规则与非组构语义理论相结合的系统,因为基于重写规则的文法形式的效力通常等同于基于基模替换的文法形式。

因此,句子“ Colorless green ideas sleep furiously”在这种方法中,不是从多个词组结构规则的应用中产生,而是将词汇填入具有以下结构的基模插槽中来生成:

表达了以下概念内容:

尽管它们非由成分组合,但这种模型具有单调性。此方法在构造文法(英语:construction grammar) 中高度发展,并且对中心语驱动词组结构文法(英语:Head-driven phrase structure grammar)和词汇功能文法(英语:Lexical functional grammar) 造成一定的影响,后两者显然被定性为词组结构文法。

 

相关

  • 构象构象异构(英语:Conformational isomerism,又译结构异构或构形异构,指由于原子环绕于化学键四周,而导致结构式相同,却具有化学构象或构象异构体之差异的分子现象。有三种效应,会使某
  • 纳西亚丁纳西亚丁汗(乌兹别克语:Nasriddinxon,1850年-1876年),浩罕汗国末代可汗。他在穆罕默德·胡达雅尔汗于1875年逃出汗国后成为可汗,一年后汗国被俄罗斯废除并入费尔干纳州。他先被移送
  • 2Yoon2YOON(韩文:투윤),为韩国女子团体4minute的子团体,隶属Cube Entertainment,成员包括许嘉允和田祉润。于2013年1月17日发行首张迷你专辑《Harvest Moon》,并以主打曲〈24/7〉在M! Co
  • 中华人民共和国国家级海洋特别保护区中华人民共和国的海洋特别保护区,是指具有特殊地理条件、生态系统、生物与非生物资源及海洋开发利用特殊要求,需要采取有效的保护措施和科学的开发方式进行特殊管理的区域。海
  • 萌芽《萌芽》是中国大陆的一家以青少年为读者对象的青年文学刊物。隶属于上海市文联。《萌芽》杂志创刊于1956年,是中华人民共和国成立后的第一家面向青年的文学刊物。1966年因“
  • 克里斯托费尔符号克氏符号,全称克里斯托费尔符号(Christoffel symbols),在数学和物理中,是从度量张量导出的列维-奇维塔联络(Levi-Civita connection)的坐标表达式。因埃尔温·布鲁诺·克里斯托费
  • 三浦氏三浦氏,是日本平安时代相模国的武家,出自平氏,一般以三浦党称之。他们在三浦半岛有很大影向力,并曾支持源赖朝建立镰仓幕府,但在1247年宝治合战被北条时赖消灭。但三浦氏仍生存于
  • 四·一九运动四·一九运动(朝鲜语:4·19 혁명/4·19 革命)是一场于1960年3月起由韩国中学、大学生和劳工领导的学运,当时由于韩国总统李承晚在第四任总统选举(朝鲜语:대한민국 제4대 대통령 선
  • 陈陛陈陛(?-1627年),字子素,河南归德府夏邑县人。父陈世恩,万历十七年进士,工科给事中。兄陈陞,万历二十九年进士,户部员外郎。万历四十年(1612年)壬子科河南乡试第三名经魁,四十一年(1613年)联捷癸丑科进士,初授户部主事,以迎养父母改就任南京吏部主事,转礼部祠祭主事,升考功司郎中,天启二年升山西河东道按察司副使,改调平阳道副使,三年转陕西按察司督粮道副使,六年官至山东天津粮储道右参政,不久因同官为魏忠贤建坊,愤而引疾归乡,很快病逝。
  • 民主联盟 (南非)民主联盟(南非语:Demokratiese Alliansie,英语:Democratic Alliance;简称为DA)是南非的一个政党,2009年大选后成为西开普省的执政党。民主联盟属于广泛的中间派,但政策有时会倾向中间偏左或中间偏右。该党是国际自由联盟及非洲自由党网络(英语:Africa Liberal Network)的成员。现时是南非最大反对党。民主联盟的前身是进步党(英语:Progressive Party (South Africa))、进步改革党(英语:Progressive Reform