n元语法

✍ dations ◷ 2025-11-30 03:09:26 #n元语法
n元语法(英语:n-gram)指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率论、通信理论、计算语言学(如基于统计的自然语言处理)、计算生物学(如序列分析)、数据压缩等领域。当n分别为1、2、3时,又分别称为一元语法(unigram)、二元语法(bigram)与三元语法(trigram)。

相关

  • 裂谷热裂谷热(英语:Rift Valley fever)又称作里夫谷热,是一种由病毒引起的人畜共通病,它的症状程度从轻微到严重都有。轻微的症状包括:发烧、肌肉疼痛、以及头痛(常持续数天到一周);严重的
  • 患者患者,又称病人、病者和病患,是指医疗服务的接受者,大多用来指罹患疾病、或身体受到创伤,而需要医生和护理人员进行治疗的人;动物如遇到相同状况,也可以患者称之。但是对于不用接受
  • 戊糖戊糖(英语:Pentose),又称为五碳糖,是一种含有5个碳原子的单糖。在1号碳上有醛基的称为五碳醛糖(戊醛糖);2号碳上有酮基的称为五碳酮糖(戊酮糖)。戊醛糖有3个手性中心,因此可能有8种旋光
  • 君士坦丁大帝306年7月25日 – 312年10月29日312年10月29日 – 324年9月19日 324年9月19日 – 337年5月22日(30年301天)弗拉维·瓦莱里乌斯·奥勒里乌斯·君士坦丁(拉丁语:Flavius Va
  • 华氏华氏温标是一种温标,符号为℉。华氏温标的定义是:在标准大气压下,冰的熔点为32℉,水的沸点为212℉,中间有180等分,每等分为华氏1度。根据德国科学家华伦海特于1724年所写的一篇期
  • 多系群多系群(英语:Polyphyletic group)在生物系统发生学中,是指一个分类群当中的成员,在演化树上分别位于相隔着其他分支的分支上;也就是说,该分类群并不包含其所有成员的最近共同祖先
  • 分子动力学分子动力学是一套分子模拟方法,该方法主要是依靠计算机来模拟分子、原子体系的运动,是一种多体模拟方法。通过对分子、原子在一定时间内运动状态的模拟,从而以动态观点考察系统
  • 大格拉斯哥大格拉斯哥(英语:Greater Glasgow)是以英国苏格兰最大都市格拉斯哥为中心的大都市。按照苏格兰统计部门定义的范围,2001年人口普查时,大格拉斯哥有人口1,199,629人,是苏格兰最大的
  • 前导链DNA复制是指DNA双链在细胞分裂分裂间期进行的以一个亲代DNA分子为模板合成子代DNA链的过程。复制的结果是一条双链变成两条一样的双链(如果复制过程正常的话),每条双链都与原来
  • 压电材料压电效应(英语:Piezoelectricity),是电介质材料中一种机械能与电能互换的现象。压电效应有两种,正压电效应及逆压电效应。压电效应在声音的产生和侦测,高电压的生成,电频生成,微量天