汉语自动句法分析

✍ dations ◷ 2025-10-21 22:46:41 #自然语言处理,计算语言学,汉字信息处理

汉语自动句法分析包含对汉语句法的定义以及自动分析方法。

对于如何定义,从汉语语言学家的角度来看,往往是考虑如何生成句子的问题;从计算语言学家的角度来看,则往往是一个思考如何拆分句子的问题。计算语言学家需要为输入的句子实现一个自动拆分方法,这是句法分析的实现形式。

指定义拆分单元的集合,将输入的句子拆分为该集合的一个子集。一个拆分单元由两部分组成,一个部分是载体,是句子的片段;另一个是载体承载的信息,用于将载体组合成句子。例如:在依存句法分析方法下,拆分单元是(词,依存关系),其中‘词’是载体,‘依存关系’是词承载的信息;在某些依赖语义的句法分析方法下,拆分单元是(短语,语义功能)。

在一个有穷的拆分单元集合下,一个句子往往有多种拆分,即使不考虑由切分载体引起的歧义(例如依存句法分析的分词歧义),一个切分为n个载体的句子有mn个拆分,m为载体信息集合的大小。同时,一个句子一般只有一个正确拆分。因此需要选择最好的拆分。这个问题往往转化为从中选择概率最大的拆分。

依存语法最早由法国语言学家L.Tesniere(英语:Lucien_Tesnière)在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。也即指出了词语之间在句法上的搭配关系,这种搭配关系是和语义相关联的。

依存语法存在一个共同的基本假设:句法结构本质上包含词和词之间的关系。这种关系称为依存关系 (Dependency Relations)。一个依存关系连接两个词,分别是核心词 (Head) 和修饰词 (Dependent)。依存关系可以细分为不同的类型,表示两个词之间的句法关系 (Dependency Relation Types)。

依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。

相关

  • 国际开发协会国际开发协会(International Development Association,简称IDA):是世界银行为帮助和促进最不发达的贫穷国家发展而设立的银行服务机构,是世界银行的组成部分。国际开发协会成立于
  • 艾诺拉·盖号艾诺拉·盖(英语:Enola Gay)是一架隶属于美国陆军航空军第509混合飞行大队(英语:509th Composite Group)的B-29超级堡垒轰炸机,“艾诺拉·盖”这命名源自该机机长保罗·蒂贝茨(Paul
  • 虱亚目见内文虱亚目(学名:Anoplura),又名吸虱亚目或裸尾目,旧作原虱目(Siphunculata),原为虱毛目之下的一个亚目,现在是啮虫目之下七个亚目之一,有约500个物种。体型较小,无翅,身体扁平,寄生于
  • 澳门行政暨公职局行政公职局(葡文:Direcção dos Serviços de Administração e Função Pública;葡文简称:SAFP),是澳门特别行政区政府负责研究、协调和辅助公共行政和公务员事务的部门,隶属
  • 台车线.mw-parser-output .RMbox{box-shadow:0 2px 2px 0 rgba(0,0,0,.14),0 1px 5px 0 rgba(0,0,0,.12),0 3px 1px -2px rgba(0,0,0,.2)}.mw-parser-output .RMinline{float:none
  • 州长 (美国) 美国众议院议长:南希·裴洛西(民主党) 多数党领袖(英语:Party leaders of the United States House of Representatives):斯坦利·霍耶(民主党) 少数党领袖(英语:Party leaders of the
  • 第二次英缅战争 大英帝国第二次英缅战争(缅甸语:အင်္ဂလိပ် မြန်မာ ဒုတိယ စစ်,1852年4月5日-1852年12月20日)是19世纪英国与缅甸的三次交战中的第二次,其结果是缅甸逐渐
  • 李梦 (女演员)李梦(1992年10月11日-),湖南长沙人,中国大陆影视女演员,毕业于北京电影学院表演系2009级本科班。2011年因参演电影《郭明义》后进入演艺圈发展,2013年因出演贾樟柯的电影《天注定》
  • 旁注标记旁注标记(ruby character),或称注音标示、加注音、Ruby字符、ruby或rubi,是一种表意文字的音标印刷方式,广泛地运用于日文及中文。一般这些字是放于表意文字的上方或右边,作为文字
  • 杭艾杭艾(满语:ᡥᠠᠩᡤᠠᡳ,穆麟德:),满洲人,清朝政治人物、清朝兵部尚书。曾任左都御史。康熙二十一年十月庚寅,接替折尔肯,担任清朝兵部尚书,后改户部尚书。由哈占接任。康熙年间卒。