汉语自动句法分析

✍ dations ◷ 2025-11-11 05:26:54 #自然语言处理,计算语言学,汉字信息处理

汉语自动句法分析包含对汉语句法的定义以及自动分析方法。

对于如何定义,从汉语语言学家的角度来看,往往是考虑如何生成句子的问题;从计算语言学家的角度来看,则往往是一个思考如何拆分句子的问题。计算语言学家需要为输入的句子实现一个自动拆分方法,这是句法分析的实现形式。

指定义拆分单元的集合,将输入的句子拆分为该集合的一个子集。一个拆分单元由两部分组成,一个部分是载体,是句子的片段;另一个是载体承载的信息,用于将载体组合成句子。例如:在依存句法分析方法下,拆分单元是(词,依存关系),其中‘词’是载体,‘依存关系’是词承载的信息;在某些依赖语义的句法分析方法下,拆分单元是(短语,语义功能)。

在一个有穷的拆分单元集合下,一个句子往往有多种拆分,即使不考虑由切分载体引起的歧义(例如依存句法分析的分词歧义),一个切分为n个载体的句子有mn个拆分,m为载体信息集合的大小。同时,一个句子一般只有一个正确拆分。因此需要选择最好的拆分。这个问题往往转化为从中选择概率最大的拆分。

依存语法最早由法国语言学家L.Tesniere(英语:Lucien_Tesnière)在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。也即指出了词语之间在句法上的搭配关系,这种搭配关系是和语义相关联的。

依存语法存在一个共同的基本假设:句法结构本质上包含词和词之间的关系。这种关系称为依存关系 (Dependency Relations)。一个依存关系连接两个词,分别是核心词 (Head) 和修饰词 (Dependent)。依存关系可以细分为不同的类型,表示两个词之间的句法关系 (Dependency Relation Types)。

依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。

相关

  • 肽聚糖肽聚糖,存在于真细菌中的革兰氏阳性菌和革兰氏阴性菌的细胞壁中。肽聚糖的骨架是由两种糖衍生物:N-乙酰葡糖胺(GlcNAc)和N-乙酰胞壁酸(MurNAc)交替相连而形成的多糖链,这些链相互交
  • 哲罗姆哲罗姆,天主教译圣热罗尼莫或圣叶理诺,也译作圣杰罗姆(约340年-420年;英文:Jerome(以前叫 Saint Hierom);拉丁文:Eusebius Sophronius Hieronymus;希腊文:Εὐσέβιος Σωφρόν
  • 葡萄胎葡萄胎也称水泡状胎、水泡状胎块(Hydatidiform Mole) 是一种异常的人类妊娠,系由着床但未成功发育的受精卵所造成。因其特征为胎盘绒毛间质水肿,形成透明或半透明的薄壁水泡,形似
  • 日本驻韩大使馆日本驻韩国大使馆(日语:在大韓民国日本国大使館;朝鲜语:주 대한민국 일본 대사관/駐大韓民國日本大使館 Ju Daehanminguk Ilbon Daesagwan */?)是日本驻大韩民国的最高级别外交
  • 公关摄影公关摄影,是公共关系摄影的简称,是摄影师为公关公司或利益集团有计划、有目的采集经过事先策划,充分准备好的公共关系活动的图片,从而进行有益于企业宣传,树立自身形象的摄影活动
  • 琼脂平板琼脂平板(英语:Agar Plate)是一种把消毒后的培养基加上繁殖微生物所需材料(通常是洋菜及养分)后制成的有盖培养皿。由于提供了微生物繁殖的有利条件,琼脂平板能够用来种出不同的微
  • 对外情报局 俄罗斯联邦对外情报局(俄语:Служба Внешней Разведки,英语:Foreign Intelligence Service of the Russian Federation)是俄罗斯的情报机关之一,专责俄国境
  • 贝蒂·弗里丹贝蒂·弗里丹(英语:Betty Friedan,1921年2月4日-2006年2月4日),为一位美国作家、编辑,在近代女权运动中扮演着重要的角色,其著作【女性的奥秘】为提倡自由主义女性主义的经典。1921
  • 密西西比在燃烧《密西西比在燃烧》(英语:,又译《烈血大风暴》)是一部1988年英国导演亚伦·帕克执导的美国犯罪惊悚电影,Chris Gerolmo(英语:Chris Gerolmo)编剧。改编自1964年美国联邦调查局调查在
  • 六年计划六年计划是为了让波兰经济迎合苏维埃经济所设计,以“新铸造厂(Nowa Huta)”等重工业化计划为其中心思想。该计划于1950年7月21日在众议院通过,尽管后来几经修正,却从未彻底完成。