n元语法

✍ dations ◷ 2025-06-28 11:07:48 #n元语法
n元语法(英语:n-gram)指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率论、通信理论、计算语言学(如基于统计的自然语言处理)、计算生物学(如序列分析)、数据压缩等领域。当n分别为1、2、3时,又分别称为一元语法(unigram)、二元语法(bigram)与三元语法(trigram)。

相关

  • 预期寿命平均寿命、生命期望或预期寿命(英语:life expectancy),指生物群体中衡量单一生命存活平均长度的统计量。预期寿命最常用的测量方法是自出生起算(英语:Life expectancy at birth,LEB
  • 螺旋动物螺旋动物(学名:Spiralia),又称螺旋卵裂动物,是原口动物的一大分支,包括多种型态的动物门类,如软体动物、环节动物门、扁形动物门等。其动物在发育的早期过程中以经典的“螺旋式”卵
  • 嗜中性白血球中性粒细胞(英语:Neutrophil 或 Neutrocyte,或全称 Neutrophilic Granulocyte)亦称嗜中性粒细胞或嗜中性多核球,是血液白细胞的一种,也是哺乳动物血液中最主要的一种白细胞。中性
  • 工作贫穷工作贫穷(英语:Working poor),又称在职贫穷、穷忙族、薪贫族、勤劳贫困阶级、工作贫困阶级,是指拥有固定工作但相对贫穷(例如收入低于特定贫穷线)的人士。有别于失业者,他们虽然有得
  • 加拉巴哥群岛坐标:0°40′S 90°33′W / 0.667°S 90.550°W / -0.667; -90.550科隆群岛,又称加拉帕戈斯群岛(西班牙语:Islas Galápagos,官方名称Archipiélago de Colón),位于太平洋东部,接近
  • 放射性标记放射性示踪剂(英语:Radioactive tracer),又称放射性标记物(radioactive label),一种化合物,其中的一个或多个原子被替换为放射性同位素(radioisotope),是同位素标记(isotopic labeling)的
  • 云母云母是云母族矿物的统称,是钾、铝、镁、铁、锂等金属的铝硅酸盐,都是层状结构,单斜晶系。晶体呈假六方片状或板状,偶见柱状。层状解理非常完全,有玻璃光泽,薄片具有弹性。英语中“
  • 希农城堡希农城堡(法语:Forteresse royale de Chinon 或 Château de Chinon)位于法国的安德尔-卢瓦尔省。希依城堡由卢瓦尔王朝的布洛瓦伯爵西奥博尔德一世于945年兴建,于12世纪时,则被
  • 雅克·卡蒂埃雅克·卡蒂埃(法语:Jacques Cartier,1491年12月31日-1557年9月1日)是法国探险家、航海家。雅克·卡蒂埃在法国国王弗朗索瓦一世的资助下一共进行了三次航行。既未能开辟通往东方
  • BkOsub2/sub二氧化锫是锫已知的两种氧化物之一,化学式为BkO2。它是浅棕黄色至棕褐色固体,属正交晶系(萤石结构),晶胞参数a=5.334±0.005。它可由三氧化二锫在空气中加热至600°C得到。