汉语自动句法分析

✍ dations ◷ 2025-08-21 07:55:22 #自然语言处理,计算语言学,汉字信息处理

汉语自动句法分析包含对汉语句法的定义以及自动分析方法。

对于如何定义,从汉语语言学家的角度来看,往往是考虑如何生成句子的问题;从计算语言学家的角度来看,则往往是一个思考如何拆分句子的问题。计算语言学家需要为输入的句子实现一个自动拆分方法,这是句法分析的实现形式。

指定义拆分单元的集合,将输入的句子拆分为该集合的一个子集。一个拆分单元由两部分组成,一个部分是载体,是句子的片段;另一个是载体承载的信息,用于将载体组合成句子。例如:在依存句法分析方法下,拆分单元是(词,依存关系),其中‘词’是载体,‘依存关系’是词承载的信息;在某些依赖语义的句法分析方法下,拆分单元是(短语,语义功能)。

在一个有穷的拆分单元集合下,一个句子往往有多种拆分,即使不考虑由切分载体引起的歧义(例如依存句法分析的分词歧义),一个切分为n个载体的句子有mn个拆分,m为载体信息集合的大小。同时,一个句子一般只有一个正确拆分。因此需要选择最好的拆分。这个问题往往转化为从中选择概率最大的拆分。

依存语法最早由法国语言学家L.Tesniere(英语:Lucien_Tesnière)在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。也即指出了词语之间在句法上的搭配关系,这种搭配关系是和语义相关联的。

依存语法存在一个共同的基本假设:句法结构本质上包含词和词之间的关系。这种关系称为依存关系 (Dependency Relations)。一个依存关系连接两个词,分别是核心词 (Head) 和修饰词 (Dependent)。依存关系可以细分为不同的类型,表示两个词之间的句法关系 (Dependency Relation Types)。

依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。

相关

  • 鼻敏感过敏性鼻炎,又称为鼻敏感、干草热、花粉热、花粉症或季节性过敏性鼻炎,是因为免疫系统受到空气中的过敏原影响而导致的鼻炎症状。征兆和病症包括流鼻涕或鼻塞、打喷嚏、眼睛的
  • KMUP-1KMUP-1是一种黄嘌呤衍生物,具有磷酸二酯酶抑制剂活性。
  • 阿伏伽德罗定律阿伏伽德罗定律(英语:Avogadro's law)是意大利化学家阿伏伽德罗于1811年提出的一条假说,时称“阿伏伽德罗假说”,后经大量实验证实为定律。内容是:同温、同压时,同体积的任何气体含
  • 氦二聚体氦二聚体是一种由范德华力键合的化合物,化学式He2。它包含了2个氦原子。 它是最大的双原子分子,有5200皮米大。(上图所示)。氦二聚体的键能非常弱,只要分子一旋转或震动到一定程
  • 休斯湖休斯湖(英语:Lake Hughes)是位于美国加利福尼亚州洛杉矶县的一个人口普查指定地区。休斯湖的座标为34°41′23″N 118°26′27″W / 34.68972°N 118.44083°W / 34.68972; -11
  • 哲合忍耶哲合忍耶派,即“高赞派”,是中国伊斯兰教苏菲主义中传播最广,信仰者最多的一支门宦(苏菲派别)。起源于中亚的纳克什班迪教团,公元18世纪由始传者马明心引入中国。新教进入中国后与
  • 南流江三角洲南流江三角洲,是广西最大的三角洲,分布于南流江及饮江。纵30多公里,横5-10公里,面积550平方公里。地势低平土壤肥沃,沿岸潮滩发育良好。
  • 叶笛 (作家)叶笛(1931年9月21日-2006年5月9日),原名叶寄民,台湾诗人、作家、评论家、翻译工作者、教育工作者,台湾台南人。台南师范学校(现国立台南大学)毕业,后来到日本留学,在东京大学等校学习
  • 尖药花属尖药花属(学名:)是茜草科下的一个属,为被毛草本或矮小亚灌木植物。该属共有约40种,分布于印度、斯里兰卡、马来西亚至泰国。
  • 无敌怪医《无敌怪医》(日语:スーパードクターK)及其续作《新无敌怪医》(Doctor K)是日本漫画家真船一雄的日本漫画作品。于讲谈社的漫画杂志《周刊少年Magazine》1988年17号到1996年42号