汉语自动句法分析

✍ dations ◷ 2025-04-30 02:59:10 #自然语言处理,计算语言学,汉字信息处理

汉语自动句法分析包含对汉语句法的定义以及自动分析方法。

对于如何定义,从汉语语言学家的角度来看,往往是考虑如何生成句子的问题;从计算语言学家的角度来看,则往往是一个思考如何拆分句子的问题。计算语言学家需要为输入的句子实现一个自动拆分方法,这是句法分析的实现形式。

指定义拆分单元的集合,将输入的句子拆分为该集合的一个子集。一个拆分单元由两部分组成,一个部分是载体,是句子的片段;另一个是载体承载的信息,用于将载体组合成句子。例如:在依存句法分析方法下,拆分单元是(词,依存关系),其中‘词’是载体,‘依存关系’是词承载的信息;在某些依赖语义的句法分析方法下,拆分单元是(短语,语义功能)。

在一个有穷的拆分单元集合下,一个句子往往有多种拆分,即使不考虑由切分载体引起的歧义(例如依存句法分析的分词歧义),一个切分为n个载体的句子有mn个拆分,m为载体信息集合的大小。同时,一个句子一般只有一个正确拆分。因此需要选择最好的拆分。这个问题往往转化为从中选择概率最大的拆分。

依存语法最早由法国语言学家L.Tesniere(英语:Lucien_Tesnière)在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。也即指出了词语之间在句法上的搭配关系,这种搭配关系是和语义相关联的。

依存语法存在一个共同的基本假设:句法结构本质上包含词和词之间的关系。这种关系称为依存关系 (Dependency Relations)。一个依存关系连接两个词,分别是核心词 (Head) 和修饰词 (Dependent)。依存关系可以细分为不同的类型,表示两个词之间的句法关系 (Dependency Relation Types)。

依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。

相关

  • 热导管热导管,或称热管,是一种具有快速均温特性的特殊材料,其中空的金属管体,使其具有质轻的特点,而其快速均温的特性,则使其具有优异的热超导性能;热管的运用范围相当广泛,最早期运用于航
  • 发色团简单来说发色团是分子中与颜色有关的部分。 当分子吸收某特定可见光的波长射出或反射其他波长的光时会产生颜色。而发色团是指在分子中的某个两个分子轨域的能量差落在可见
  • 宁远之战抚清之战 · 萨尔浒之战 · 开铁之战 · 辽沈之战 · 镇江之战 · 林畔之战 · 广宁之战 · 辽南之战 · 亮马佃大捷 · 牛毛大捷 · 乌鸡关大捷 · 横
  • 硫酸铀(IV)硫酸铀(IV)是一种水溶性铀化合物,化学式为U(SO4)2,高毒。硫酸铀酰溶液经过光化学还原可以得到硫酸铀(IV),以乙醇为还原剂,光化学还原可以在日光下进行。硫酸铀(IV)在溶液中结晶,
  • 芭娜娜波卡芭娜娜波卡又名香蕉百香果(在夏威夷被称为banana poka;英文名称:banana passionfruit;西班牙文名称:curuba、tumbo),又名香蕉百香果,是西番莲属中的一种水果,因其黄色可食果实外型神
  • 原劳亚大陆原劳亚大陆(Proto-Gondwana)意为“最初的劳亚大陆”,是个史前大陆。原劳亚大陆曾先后是罗迪尼亚大陆、潘诺西亚大陆的一部分。在罗迪尼亚大陆时期,后来的劳伦大陆东侧连接者华南
  • 盖伦·杰英盖伦·杰英(英语:Galen Gering,1971年2月13日-)是美国的一位演员。他出演过众多肥皂剧,包括在NBC长寿肥皂剧我们的日子中饰演Rafe Hernandez。他出生在洛杉矶,是一位俄罗斯裔犹太人
  • 姜秀銮姜秀銮画像姜秀銮(1783年-1846年),台湾清治时期人物,知名拓垦家,金广福垦号之首。淡水县九芎林庄人(今新竹县芎林乡),客家籍,祖籍广东惠州陆丰,为新竹大隘地区开山之祖,因屡屡受召协防,受
  • 下蜀茶场下蜀茶场是江苏省句容市人民政府农业委员会下属的一个国营农场,位于下蜀镇境内。1954年,茶场建场。2006年《句容年鉴》指茶场拥有茶园面积为80公顷(1200亩),其中良种茶园26.67公
  • 麦科·韦尔佐托麦科·韦尔佐托(意大利语:Maicol Verzotto;1988年5月24日-)是一位意大利跳水运动员。他曾经两次获得意大利的全国冠军。也曾代表意大利参加2016年夏季奥林匹克运动会。