n元语法

✍ dations ◷ 2025-08-08 05:22:59 #n元语法
n元语法(英语:n-gram)指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率论、通信理论、计算语言学(如基于统计的自然语言处理)、计算生物学(如序列分析)、数据压缩等领域。当n分别为1、2、3时,又分别称为一元语法(unigram)、二元语法(bigram)与三元语法(trigram)。

相关

  • 3第3周期元素是元素周期表中第三行(即周期)的元素。含有:
  • 乙胺嘧啶乙胺嘧啶(英语:Pyrimethamine)商品名叫达拉匹林(Daraprim),是一种可以与甲酰四氢叶酸治疗一起弓形虫病和等孢球虫病的药物。还与氨苯砜一起用于预防HIV / AIDS患者的肺孢子虫肺炎(P
  • 环气管韧带环气管韧带(cricotracheal ligament)主要是将环状软骨与气管的第一环连接。它类似于将气管的软骨环彼此连接的纤维膜。本条目包含来自属于公共领域版本的《格雷氏解剖学》之内
  • 数码显微镜数码显微镜(英语:Digital microscope或Computer microscope)是一种结合传统光学显微镜及视像镜头而成的显微镜,主要用于教学用途。数码显微镜的主要好处在于:传统的光学显微镜
  • 方铅矿方铅矿(英语:Galena,又称立方硫化铅)是一种铅与硫的化合物,其英文名称源自于拉丁文,为铅之意。化学式为PbS(理论组成:铅:86.60%,硫:13.40%),混入物以银为最常见,其次为铜与锌,有时含有铁、
  • 水晶石英(英语:quartz)是大陆地壳数量第二多的矿石,仅次于长石,其晶体结构是SiO4(硅-氧四面体)的连续框架,其中每个氧在两个四面体之间共享,得到SiO2的总化学式,石英的种类有很多,无色全
  • 多布然斯基-马勒基因不相容多布然斯基-马勒基因不相容(英语:Dobzhansky-Muller incompatibility),又称为贝特森-多布然斯基-马勒基因不相容(英语:Bateson-Dobzhansky-Muller incompatibility)是解释基因不相
  • 呼吸道上皮伪复层纤毛柱状上皮属于另一种单层柱状上皮的变异,细胞皆具有纤毛,又可以称为假复层纤毛柱状上皮。之所以称做伪复层是因为其在切片下看起来细胞好像多于一层所造成的错误观念
  • 钦察汗国钦察汗国(英语:Golden Horde;蒙古语:Алтан Орд,Altan Ord)(1242年-1502年)又称金帐汗国或大帐汗国,是蒙古四大汗国之一,元朝称之为大元钦察术赤兀鲁思,对金帐汗庭称为金斡耳朵,称
  • 电能电能(Electrical energy),是指电以各种形式做功(即产生能量)的能力。电能被广泛应用在动力、照明、冶金、化学、纺织、通信、广播等各个领域,是科学技术发展、国民经济飞跃的主要