n元语法

✍ dations ◷ 2025-09-26 14:29:56 #n元语法
n元语法(英语:n-gram)指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率论、通信理论、计算语言学(如基于统计的自然语言处理)、计算生物学(如序列分析)、数据压缩等领域。当n分别为1、2、3时,又分别称为一元语法(unigram)、二元语法(bigram)与三元语法(trigram)。

相关

  • 热性痉挛热性痉挛(febrile convulsion),又称作又称作发烧性抽搐、热性抽搐、热性惊厥、热性全身痉挛,是一种癫痫性发作(英语:epileptic seizure),伴有体温升高的症状但是并无任何潜在的健康
  • NLM美国国家医学图书馆(英语:The United States National Library of Medicine,NLM),由美国联邦政府经营管理,是世界上最大的医学图书馆,并设有研究中心。其前身为成立于1836年的美国
  • 哈伯特顶点在1953年,美国地质学家哈伯特(King Hubbert)大胆预言,美国石油生产速率将于60年代末至70年代初左右达到顶峰,达到了顶峰之后就会一直下降。这种情形叫做哈伯特顶点(Hubbert's peak
  • 犹太-葡萄牙语犹太-葡萄牙语(Judeu-Português,又称卢西塔尼亚语,Lusitanic)是一种大体而言已经迈向绝种的犹太语言。在十六世记之前,犹太-葡萄牙语是葡萄牙犹太人日常生活使用的语言,后来与流
  • 蒙眼貂蒙眼貂(学名:Mustela putorius furo),又名雪貂、地中海雪貂,是欧洲鼬的驯养亚种。它们是两性异形体(英语:Sexual dimorphism)的,雄貂比雌貂大。它们一般呈褐色、黑色、白色或混色,公貂
  • 滨松医科大学滨松医科大学(はままついかだいがく、Hamamatsu University School of Medicine)位于静冈县滨松市半田山的日本国立大学。在JR滨松站北出口汽车站13号上车口乘坐“磐田山手线
  • 乙苯乙苯(英语:Ethylbenzene,分子式:C6H5CH2CH3)是一个芳香族的有机化合物,主要用途是在石油化学工业作为生产苯乙烯的中间体,所制成的苯乙烯一般被用来制备常用的塑料制品——聚苯乙烯
  • 彼得·雷文彼得·汉密尔顿·雷文(英语:Peter Hamilton Raven,1936年6月13日-),美国植物学家和环保主义者,在密苏里植物园长期担任主任和名誉主席。1936年6月13日出生于中国上海,他的父母是美国
  • 高卢雄鸡高卢雄鸡(法语:Le Coq gaulois),或高卢公鸡,是法国的拟物化形象。高卢雄鸡来源于罗马帝国时代,法兰西被称为高卢(Gallia),高卢人叫Gallus,而Gallus在拉丁语另一意思是雄鸡,所以被称为
  • 佐川真人佐川真人(日语:佐川眞人,1943年8月3日-),日本发明家、企业家,以发明钕铁硼磁铁而知名。1978年,佐川萌发发了在化合物中加入小原子半径元素来扩大铁原子间距的想法,开始了实验,最后制出