树-邻接文法

✍ dations ◷ 2025-12-06 16:35:07 #树-邻接文法

树-邻接文法(TAG)是 Aravind Joshi 定义的文法形式化。树-邻接(adjoining)文法在某种意义上类似于上下文无关文法,但是基本的重写单位是树而不是符号。上下文无关文法有把符号重写为其他符号的规则,而树-毗连文法有把树的节点重写为其他树的规则。

TAG 中的规则是带有叫做“足节点”的特殊叶子的树,它们锚接(anchor)到一个字。在 TAG 中有两个种类的基本树:“初始”树(经常被表示为 ' α {displaystyle alpha } ')和“辅助”树(' β {displaystyle beta } ')。初始树表示基本的价(valency)关系,而辅助树允许递归。辅助树有标记(label)上同样符号的根(顶)节点和足节点。推导开始于初始树,通过要么“代换”要么“附加”来结合。代换把末梢节点替换为其顶节点有同样符号的另一个树。附加把一个辅助树插入到另一个树的中心。辅助树的根/足标记必须匹配它所邻接的节点的标记。其他 TAG 的变体允许多种成分的树,带有多个足节点的树,和其他扩展。

树-邻接文法经常被描述为“适度上下文有关的”,这意味着它们有(在弱生成能力方面上)特定性质使其有比上下文无关文法更强力,但有比附标文法或上下文有关文法更弱的能力。适度上下文有关文法被推测为足够强力可以建模自然语言,而仍保持在一般情况下有效解析。 由于它们的形式特性,TAG 经常被用于计算语言学和自然语言处理。

TAG 起源于 Joshi 和他的学生对附加文法(AG)家族和 Zellig Harris 的“字符串文法”的研究 。AG 以自然和高效的方式处理语言的向心(英语:Endocentric and exocentric)性质,但是没有对离心构造的好特征描述;重写文法或短语-结构文法(PSG)正好反过来。在 1969 年,Joshi 通过混合两种类型的规则介入了开拓出这种补足的文法家族。一些非常简单的重写规则足够生成附加规则的字符串的词汇表。这个家族不同于乔姆斯基层级,但是有所交叠。

TAG 可以描述有平方的语言(在其中某个任意字符串被重复),和语言 { a n b n c n d n | n 1 } {displaystyle {a^{n}b^{n}c^{n}d^{n}|ngeq 1}} ,有立方的语言(就是三倍的字符串)或有相等长度的多于四个不同字符的字符串的语言不可以被树-邻接文法所生成。为此,树-毗连文法生成的语言被称为“适度上下文有关语言”。

相关

  • 农学农学,狭义上专指农艺学(英语:Agronomy)是研究与农作物生产相关领域的科学,包括作物生长发育规律及其与外界环境条件的关系、病虫害防治、土壤与营养、种植制度、遗传育种等领域。
  • 韩国城韩国街(韩语:코리아타운)是指在朝鲜半岛之外,有大量韩侨集中生活的地区。
  • 亚寒带季风气候亚寒带季风气候(柯本气候分类法:Dwc)是温带季风气候向高纬的延伸,仅俄罗斯境内有分布。由海陆热力差异造成。比起副极地大陆性气候,亚寒带季风气候夏季降水更多,冬季更暖和,夏季更
  • 小松英一郎小松英一郎(日语:小松 英一郎/こまつ えいいちろう ,1974年-),日本物理学家,现为马克斯·普朗克天体物理研究所所长,研究方向为观测宇宙学。2001年获得东北大学博士学位。
  • 何塞·桑托斯·塞拉亚何塞·桑托斯·塞拉亚·洛佩斯 (西班牙语: José Santos Zelaya López, 1853 – 1919) 是尼加拉瓜政治家,曾于1893年至1909年担任尼加拉瓜总统。1893年,塞拉亚当选尼加拉瓜总
  • 2005年2月逝世人物列表2005年逝世人物列表:1月 - 2月 - 3月 - 4月 - 5月 - 6月 - 7月 - 8月 - 9月 - 10月 - 11月 - 12月下面是2005年2月逝世的知名人士列表:
  • 丽莎·麦克弗森丽莎·麦克弗森(英语:Lisa McPherson,1959年2月10日-1995年12月5日),美国德克萨斯州达拉斯人,是一个山达基信徒,她在山达基教会的旗舰服务机构(FSO)照顾下,死于肺栓塞。她去世后,山达基
  • 一对一 (小说)《一对一》(),爱尔兰作家詹姆士·乔伊斯的短篇小说,收录于1914年的短篇小说集《都柏林人》(Dubliners)。 华林顿(Farrington)是一位窝囊的销售员,白天在办公室偷懒,被主管责骂,晚上在酒
  • 田同之田同之,字彦威,一字在田。山东德州人。祖父田雯与王士禛齐名。康熙五十九年(1720)举人,官国子监助教。论诗服信王士禛。晚年致力于词学之道,尝引曹贞吉之言谓“词之为体如美人,而诗则壮士也。”,有《西圃词说》,又有《晚香词》集。
  • 让·科克托让·莫里斯·欧仁·克莱芒·科克托(法语:Jean Maurice Eugène Clément Cocteau,法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Gentium Alternative","TITUS Cyberbit Basic","Arial Unicode M