汉语自动句法分析

✍ dations ◷ 2025-09-12 17:52:58 #自然语言处理,计算语言学,汉字信息处理

汉语自动句法分析包含对汉语句法的定义以及自动分析方法。

对于如何定义,从汉语语言学家的角度来看,往往是考虑如何生成句子的问题;从计算语言学家的角度来看,则往往是一个思考如何拆分句子的问题。计算语言学家需要为输入的句子实现一个自动拆分方法,这是句法分析的实现形式。

指定义拆分单元的集合,将输入的句子拆分为该集合的一个子集。一个拆分单元由两部分组成,一个部分是载体,是句子的片段;另一个是载体承载的信息,用于将载体组合成句子。例如:在依存句法分析方法下,拆分单元是(词,依存关系),其中‘词’是载体,‘依存关系’是词承载的信息;在某些依赖语义的句法分析方法下,拆分单元是(短语,语义功能)。

在一个有穷的拆分单元集合下,一个句子往往有多种拆分,即使不考虑由切分载体引起的歧义(例如依存句法分析的分词歧义),一个切分为n个载体的句子有mn个拆分,m为载体信息集合的大小。同时,一个句子一般只有一个正确拆分。因此需要选择最好的拆分。这个问题往往转化为从中选择概率最大的拆分。

依存语法最早由法国语言学家L.Tesniere(英语:Lucien_Tesnière)在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。也即指出了词语之间在句法上的搭配关系,这种搭配关系是和语义相关联的。

依存语法存在一个共同的基本假设:句法结构本质上包含词和词之间的关系。这种关系称为依存关系 (Dependency Relations)。一个依存关系连接两个词,分别是核心词 (Head) 和修饰词 (Dependent)。依存关系可以细分为不同的类型,表示两个词之间的句法关系 (Dependency Relation Types)。

依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。

相关

  • 北塞浦路斯面积以下资讯是以2011年估计家用电源国家领袖国内生产总值(国际汇率) 以下资讯是以2014年估计立国历史北塞浦路斯土耳其共和国(Kuzey Kıbrıs Türk Cumhuriyeti,缩写为KKTC) 通
  • 上埃及上下埃及乃埃及在前王朝时期,以孟斐斯为界,位处尼罗河上下游的两个各自独立政权。上游南方地区为上埃及(Upper Egypt),下游北方地区为下埃及(Lower Egypt)。埃及的统一及由之而来的
  • 塞缪尔·R·麦凯尔维塞缪尔·R·麦凯尔维国家森林(英语:Samuel R. McKelvie National Forest)位于美国内布拉斯加州沙丘(英语:Sandhills (Nebraska))中北部,于1971年10月15日设立(森林此前自1902年以来
  • 洞穴巨人巨怪(Troll)或译作山怪、巨魔、洞穴巨人,是一个北欧神话中一种智力低下的食人巨人。在北欧,巨怪原与巨人相同,但巨怪体型较小。此相异处后来由残暴的巨人(类似英国的巨魔,其有时也
  • 2011年5月逝世人物列表2011年逝世人物列表:1月 - 2月 - 3月 - 4月 - 5月 - 6月 - 7月 - 8月 - 9月 - 10月 - 11月 - 12月下面是2011年5月逝世的知名人士列表:
  • 佐佐木大介佐佐木大介(日语:佐々木大介/ささき だいすけ ,1987年6月15日-,旧艺名为青山春(日语:青山 ハル)),日本男演员,出生于日本北海道。曾在漫画改编电影的作品《好想告诉你》中饰演真田龙;在
  • 约瑟夫约瑟夫,源于希伯来语יוֹסֵף,译自 יהוה להוסיף,根据《希伯来圣经》,其意思是“上帝将提升”。在阿拉伯语(包括《古兰经》)为يوسف ,维吾尔族人常用为玉素甫。西
  • 龚立本龚立本,字渊孟,居冶塘大河(今大河村)。隆庆六年(1572年)出生,早年是县学诸生,知县杨涟以国士待之。万历四十三年(1615年),中举人,选任太平府教授。知崇德县。温体仁之子不法乡里,贩卖私盐
  • 演景演景(英语:Demoscene)是一种计算机艺术亚文化, 以制作演示——即一种实时计算机展示——为专业, 通过包含音乐与实时渲染的画面的包兼视听效果的演示程序来表现制作者的艺术、
  • 桃柘罗汉松桃柘罗汉松(学名:;毛利语:Tōtara),也称作新西兰罗汉松,是新西兰特有的罗汉松。在整个北岛、南岛的东北部的低地、山地及亚高地上生长,最高生长环境可达海拔600米。桃柘罗汉松常在土