汉语自动句法分析

✍ dations ◷ 2025-04-04 06:39:53 #自然语言处理,计算语言学,汉字信息处理

汉语自动句法分析包含对汉语句法的定义以及自动分析方法。

对于如何定义,从汉语语言学家的角度来看,往往是考虑如何生成句子的问题;从计算语言学家的角度来看,则往往是一个思考如何拆分句子的问题。计算语言学家需要为输入的句子实现一个自动拆分方法,这是句法分析的实现形式。

指定义拆分单元的集合,将输入的句子拆分为该集合的一个子集。一个拆分单元由两部分组成,一个部分是载体,是句子的片段;另一个是载体承载的信息,用于将载体组合成句子。例如:在依存句法分析方法下,拆分单元是(词,依存关系),其中‘词’是载体,‘依存关系’是词承载的信息;在某些依赖语义的句法分析方法下,拆分单元是(短语,语义功能)。

在一个有穷的拆分单元集合下,一个句子往往有多种拆分,即使不考虑由切分载体引起的歧义(例如依存句法分析的分词歧义),一个切分为n个载体的句子有mn个拆分,m为载体信息集合的大小。同时,一个句子一般只有一个正确拆分。因此需要选择最好的拆分。这个问题往往转化为从中选择概率最大的拆分。

依存语法最早由法国语言学家L.Tesniere(英语:Lucien_Tesnière)在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。也即指出了词语之间在句法上的搭配关系,这种搭配关系是和语义相关联的。

依存语法存在一个共同的基本假设:句法结构本质上包含词和词之间的关系。这种关系称为依存关系 (Dependency Relations)。一个依存关系连接两个词,分别是核心词 (Head) 和修饰词 (Dependent)。依存关系可以细分为不同的类型,表示两个词之间的句法关系 (Dependency Relation Types)。

依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。

相关

  • 美国化学学会美国化学学会(英语:American Chemical Society,简称为ACS)是一个化学领域的专业组织。1876年于美国纽约大学成立,现有157,000位来自化学与化工界各个分支的会员,总部位于华盛顿哥
  • 脓疱病脓痂疹(Impetigo)是涉及表层皮肤的细菌感染,常见脸、手臂或是脚上出现淡黄色痂皮,发生在腹股沟和腋窝的大型水泡较少见。病灶可能有疼痛或是搔痒感,不常引起发烧。脓痂疹通常由金
  • 巨人巨人,是神话或传说或童话中常见的生物,几乎全世界的都有他们的踪迹,由希腊神话、印欧语系神话,到中东、亚洲及美洲地区的神话及圣经内的故事都有他们的痕迹。而现在的社会中,巨人
  • 空间位阻位阻效应(也叫空间效应、空间位阻效应、立体效应)是研究分子中不同基团间电子团重叠形成的电磁力而造成的分子结构或反应取向的立体化学分枝。广泛应用于有机化学中分子结构及
  • 沧龙沧龙属(学名:Mosasaurus)是沧龙科的一个属,它们是一群肉食性海生爬行动物,也是沧龙科中最有名的属。沧龙拥有巨大的头部、强壮的颌部与尖锐的牙齿、具有鳍状肢的,外形类似蛇,拥有极
  • 长嘴鸟长嘴鸟(学名Longirostravis)是生存于白垩纪早期的一类反鸟亚纲鸟类。它们是在中国辽宁的义县组发现。它们与长翼鸟及抓握鸟属于长翼鸟科的分支。
  • 巴黎圣日耳曼足球俱乐部巴黎圣日耳曼足球俱乐部(法语:Paris Saint-Germain Football Club,法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lu
  • 圣地亚哥·拉蒙-卡哈尔圣地亚哥·拉蒙-卡哈尔(西班牙语:Santiago Ramón y Cajal,1852年5月1日-1934年10月17日),西班牙病理学家、组织学家,神经学家。生于西班牙阿拉贡佩蒂利亚德阿拉贡,1906年诺贝尔生理
  • 肌研肌研(日语:ハダラボ)是一系列由日本乐敦制药所生产的女性用化妆品。肌研是由日本乐敦制药位于日本京都的“乐敦京都科研村”产业研究实验室所在2004年配置出来的。产品开发负责
  • 2013年8月逝世人物列表2013年8月逝世人物列表,是用于汇总2013年8月期间逝世人物的列表。