n元语法

✍ dations ◷ 2024-12-22 23:44:22 #n元语法
n元语法(英语:n-gram)指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率论、通信理论、计算语言学(如基于统计的自然语言处理)、计算生物学(如序列分析)、数据压缩等领域。当n分别为1、2、3时,又分别称为一元语法(unigram)、二元语法(bigram)与三元语法(trigram)。

相关

  • 分解者分解者(英语:decomposer)主要是生态系统中的各种细菌和真菌。它们能够分解动植物尸体和遗物中的有机物并且利用其中的能量,将有机物转化成为无机物供生产者如植物再利用,重新以有
  • 基因重排基因重复或称复制基因(英语:Gene duplication (or chromosomal duplication or gene amplification))是指含有基因的DNA片段发生重复,可能因同源重组作用出错而发生,或是因为反转
  • 百白破疫苗百白破三联疫苗(英语:Diphtheria Tetanus Pertussis vaccine, DPT,港澳台译为白喉破伤风百日咳混合疫苗),是指百日咳、白喉、破伤风混合的疫苗(三合一疫苗)。它由百日咳疫苗、精制
  • 药效学药物效应动力学(英语:Pharmacodynamics (PD) ),简称药效学,是药理学的一个分支,主要研究药物作用(action)与药理效应(effects)(即药物对机体的作用及作用机制(mechanism of action)
  • 梭曼梭曼英语:(Soman),学名甲氟膦酸频那酯(O-Pinacolyl methylphosphonofluoridate),由德国诺贝尔化学奖获得者理查德·库恩博士于1944年首次合成,为G类神经性毒剂中最重要的一种毒
  • 扑热息痛7.21 g/kg (0 °C) 8.21 g/kg (5 °C) 9.44 g/kg (10 °C) 10.97 g/kg (15 °C) 12.78 g/kg (20 °C) ~14 mg/mL (20 °C)对乙酰氨基酚(英语:Acetaminophen),又称
  • 周边动脉阻塞周边动脉疾病(Peripheral artery disease, PAD),可以称为周边血管疾病(Peripheral vascular disease, PVD)、周边动脉阻塞性疾病(Peripheral artery occlusive disease, PAOD),或是
  • 水晶石英(英语:quartz)是大陆地壳数量第二多的矿石,仅次于长石,其晶体结构是SiO4(硅-氧四面体)的连续框架,其中每个氧在两个四面体之间共享,得到SiO2的总化学式,石英的种类有很多,无色全
  • 彩云彩云(英文:Iridescent Clouds)通常为一种荚状云1,具有明亮点或彩色边缘,其色彩称之为云彩(英文:Irisation2或Cloud Iridescence),属于一种光象3。常见的色彩是桃红色或绿色,位在距太阳
  • 绍里木绍里木是安哥拉东北部的城镇,也是南伦达省的首府,海拔高度1,081米,每年平均降雨量1,342毫米,雨量集中在11月至3月,镇内经济活动以农业、采钻业、手工业和捕鱼业为主,主要食粮有玉