n元语法

✍ dations ◷ 2025-11-09 10:21:42 #n元语法
n元语法(英语:n-gram)指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率论、通信理论、计算语言学(如基于统计的自然语言处理)、计算生物学(如序列分析)、数据压缩等领域。当n分别为1、2、3时,又分别称为一元语法(unigram)、二元语法(bigram)与三元语法(trigram)。

相关

  • 镇静剂镇静剂,也称作镇定剂(英语:Sedatives),是一个化学上的作用物,用作减少身体某一部分的机能或是活动,镇静剂有助于缓解人们的抑郁及焦虑;它们通常被用作治疗精神紧张的病者,镇静剂有利
  • 杀菌药杀菌药(英语:bactericide agent/drug)是指具有能将细菌杀灭药效的抗菌药物。抑菌药是与杀菌药相对的一个概念。抑菌药与杀菌药的不同之处在于抑菌药通过抑制细菌增殖发挥药效,而
  • 凯利·穆利斯凯利·班克斯·穆利斯(英语:Kary Banks Mullis,1944年12月28日-2019年8月7日),美国生物化学家。1993年因发明聚合酶链式反应(PCR),与迈克尔·史密斯分享诺贝尔化学奖。同年还获得日
  • 科罗拉多州科罗拉多州(英语:State of Colorado),简称科州,是美国西部的一州,此州最著名的是拥有洛矶山脉的最高峰,地形从东侧的平原陡然升高为西侧峻岭,地理景观十分壮丽。该州首府兼最大城为
  • 自然出版集团自然出版集团(Nature Publishing Group)是一个出版科学期刊的国际出版公司。其总部位于英国伦敦,是英国麦克米伦出版公司的一个子公司,1995年英国麦克米伦出版公司被德国 霍尔茨
  • Stramenopiles不等鞭毛总门(学名:Heterokonta)旧为不等鞭毛门,是真核生物的主要演化支之一,已知的下辖物种超过10万个物种,当中大多数属于藻类,从多细胞的大型藻类海带,到单细胞的各种浮游硅藻,这
  • 印古什共和国印古什共和国(俄语:Респу́блика Ингуше́тия,罗马化:Respublika Ingushetiya;印古什语:ГӀалгӀай Мохк,罗马化:Ğalğaj Moxk),又译殷古什共和国、英
  • 拉多加湖拉多加湖(俄语:Ладожское озеро,芬兰语:Laatokka)是位于俄罗斯西北部卡累利阿共和国和列宁格勒州的淡水湖,也是欧洲最大的湖泊和世界第14大湖泊。湖泊面积为17,891
  • RuOsub4/sub四氧化钌(RuO4)是一种反磁性的、正四面体构型的钌化合物。正如理论预测的那样,它是对称的非极性分子,但很不稳定。类似的四氧化锇用途更广,也更为人们所知。它在多数溶剂中都不稳
  • Baird规则Baird规则是有机化学的经验规则。它是指当闭合环状三重态平面型的共轭多烯(轮烯)π电子数为4n时,具有芳香性。