词组结构规则

✍ dations ◷ 2025-09-13 01:05:22 #词组结构规则

词组结构规则(Phrase structure rules),又称为短语结构规则、词组结构律,是一种用于描述特定语言句法的重写规则,与诺姆·乔姆斯基在1957年提出的早期阶段的转换文法密切相关。词组结构规则被用于将自然语言的句子分解成其构成部分,构成部分也被称为句法范畴(英语:Syntactic category),包括词汇范畴(lexical categories,词类)和词组范畴(phrasal categories)。常用的词组结构规则是根据成分关系(constituency relation)关系来操作,因此采用词组结构规则的文法是一种成分文法(英语:Phrase structure grammar),与基于依存关系(dependency relation)的依存文法(英语:Dependency grammar)形成对比。

词组结构规则通常具有以下形式:

意思是成分 A {displaystyle A} 被分成两个子成分 B {displaystyle B} C {displaystyle C} ,下面是一些英语的例子:

第一条规则:S(句子)是由一个NP(名词词组(英语:Noun phrase))后面接一个VP(动词词组)组成。

第二条规则:名词词组是由一个不定的Det(限定词)接一个N(名词)。

第三条规则:N(名词)前面可以有一个不定的AP(形容词词组(英语:adjective phrase)),后面可以接一个不定的 PP(介词词组(英语:repositional phrase))。圆括号表示不定的成分。

以句子符号S开头,并依次应用词组结构规则,最后应用取代性规则(Replacement Rules),将抽象符号换成实际词汇,可以生成许多正确的英语句子(或是由规则指定的任何语言)。如果规则是正确的,那么以这种方式产生的任何句子在文法(句法)上都应该正确。还可以预期这些规则将生成文法正确但无语义的句子,如以下的著名例子:

这句话是乔姆斯基构思的,用来说明词组结构规则能够生成句法正确但语义不正确的句子。词组结构规则将句子分解成它们的局部成分。这些成分通常表示为树结构(树状图)。乔姆斯基的句子可呈现如下:

Colorless green ideas sleep furiously.

成分是由单个节点所支配的任一词汇或词汇组合。因此,每个单独词汇都是一个成分。此外,主词NP“Colorless green ideas”、次要的NP“green ideas”和 VP“sleep furiously”也都是成分。词组结构规则和与其相关的树结构是直接成分分析(英语:Immediate constituent analysis)的一种形式。

在转换文法中,词组结构规则的系统由转换规则补充,转换规则会根据现有的句法结构产生新的句法结构(执行诸如否定化(英语:Affirmation and negation)、被动化等操作。)。这些转换并不是严格意义上的生成所需要的,因为它们产生的句子可以由一个适当扩展的词组结构规则系统单独生成,但是转换提供了更大的经济性,并使句子之间的重要关系能够反映在文法中。

词组结构规则的其中一个重要特色是以自上而下的方式检视句子结构。箭号左边的类别是大成分,在箭号右边的直接成分则是小成分。随着在给定句子的词组结构规则列表中向下移动,成分会被依次分解为其组成部分。这种自上而下的句子结构观点与许多现代理论句法学中的工作形成鲜明对比。举例来说,句子结构在最简方案中是自下而上生成的,其操作“合并”会将小成分合并为大成分,直到最大成分(即句子)形成为止。在这方面,理论句法学在很早之前就已放弃词组结构规则,但词组结构规则在计算语言学中似乎仍有其重要性。

常用的词组结构规则导致一个观点,认为句子结构是“基于成分的”。因此,采用词组结构规则的文法是“成分文法”(=词组结构文法(英语:Phrase structure grammar)),这与依存文法(英语:Dependency grammar)截然不同,依存文法将句子结构视为“基于依存的”。这意味着要使词组结构规则完全适用,就必须去理解基于成分的句子结构。成分关系是一对一或一对多的对应关系。句子中的每个词汇,在句法结构中至少会有一个节点与该词相对应。相比之下,依存关系是一对一的关系;句子中的每个词汇在句法结构中只会有一个节点与该词对应。下面的树说明了这种区别:

左边的成分树可以由词组结构规则生成。句子S被分解成越来越小的组成部分。相比之下,右边的依存树则无法由词组结构规则生成(至少不是按照一般解释方式)

一些文法的表征词组结构理论从未认可词组结构规则,而是以基模的角度来理解句子结构。这里的词组结构并非从词汇结合的规则中派生而来,而是源自句法基模或句法结构的规范或实例化,所表达的语义内容经常与在句中出现的特定词汇无关。这种方法本质上相当于一个词组结构规则与非组构语义理论相结合的系统,因为基于重写规则的文法形式的效力通常等同于基于基模替换的文法形式。

因此,句子“ Colorless green ideas sleep furiously”在这种方法中,不是从多个词组结构规则的应用中产生,而是将词汇填入具有以下结构的基模插槽中来生成:

表达了以下概念内容:

尽管它们非由成分组合,但这种模型具有单调性。此方法在构造文法(英语:construction grammar) 中高度发展,并且对中心语驱动词组结构文法(英语:Head-driven phrase structure grammar)和词汇功能文法(英语:Lexical functional grammar) 造成一定的影响,后两者显然被定性为词组结构文法。

 

相关

  • 兰姆位移物理学中,以威利斯·兰姆(Willis Lamb)为名的兰姆位移(Lamb shift)是氢原子两个能级( 2
  • 保监会印章规定:直径5厘米,中央刊国徽,由国务院制发。中国人民银行中国银行业监督管理委员会中国证券监督管理委员会中国保险监督管理委员会(英语:China Insurance Regulatory Commissi
  • 加利福尼亚州历史加利福尼亚州历史是指人类在美国西部加利福尼亚州活动的纪录,加州在13,000年至15,000年前就已经有美洲原住民居住在此。最早期的欧洲探险家在16世纪早期就已经沿着加州沿海航
  • 纸箱战机角色列表纸箱战机角色列表是介绍《纸箱战机》、《纸箱战机W》及《纸箱战机WARS》的登场人物。八神英二所率领的“黑色部队”的成员,皆戴着隐藏着脸孔的面具,后来跟随八神英二转而投效
  • 朱有济朱有济(1886年-1960年),字作舟,别号龙沙散人。天津人,祖籍江苏宝山(今属上海)。好京剧,与王庾生、刘叔度并称“天津票界三杰”。早年毕业于南开学校。曾任山东省盐运使、上海造币厂监
  • 拉票拉票,是一种政治活动,在投票前候选人或公投等议题的提名人,向持有投票权的成员,有系统有组织地接触、站台、扫楼、家访、电话游说、拜票等,正面引导对方支持。在政治竞选,投票日之
  • 天线袋口结天线袋口结(Ground-line hitch 或 Picket line hitch)是属于绑扎类绳结 (Binding knots)的一种,由袋口结(Miller's knot)演变出来的一种绳结,用以抓紧物件,如能正确地结此绳结,此结将
  • 圣爱中高前站圣爱中高前站(日语:聖愛中高前駅/せいあいちゅうこうまええき  */?)是位于青森县弘前市大字中野(日语:中野 (弘前市新市街地域))3番5号之1,弘南铁道的大鳄线车站。车站编号为KW 04
  • 赤岭畲族乡赤岭畲族乡是中国福建省漳州市漳浦县下辖的一个乡,位于漳浦县东北部。全乡总人口约1.35万人,其中畲族有1.24万人,占总人口的92%。赤岭畲族乡共辖9个行政村,分别是:杨美村、油坑村
  • 王宇 (汉朝)王宇(前1世纪-3年),字长孙,汉朝外戚,王莽的长子,母亲是王莽的正妻王氏,东平陵(今山东济南东)人。汉平帝时,王宇担心被平帝的母家卫氏报复,与卫宝通信,让卫姬上书谢恩。太皇太后王政君增加了卫氏的汤沐邑。卫姬想与平帝见面,王莽不许。王宇与他的老师吴章和内兄吕宽商量,让吕宽于夜晚拿血涂洒王莽的住宅,以恐吓王莽。守门的小吏告诉王莽,王莽大怒,将王宇下狱,命他服毒自杀。王宇妻正在怀孕,生育后也被处死。王莽建立新朝后,封王宇子六人:王千为功隆公,王寿为功明公,王吉为功成公,王宗为功崇公,王世为功昭公,王利为功著公