Lesk算法

✍ dations ◷ 2025-09-07 08:29:07 #Lesk算法

Lesk算法是迈克·莱斯克于1986年提出的词义消歧算法。

Lesk算法是基于词汇会与上下文有相同的主题这个假设,简化版的算法将有歧义的词汇在字典中的定义与上下文进行比较。修改后的算法被用于WordNet。以下为一个实作范例:

用于说明该算法的常见的范例是词汇“pine cone”,以下提供的字典定义:

PINE 1. kinds of evergreen tree with needle-shaped leaves2. waste away through sorrow or illness
CONE 1. solid body which narrows to a point2. something of this shape whether solid or hollow3. fruit of certain evergreen trees

显而易见交集次数最高的是Pine#1⋂Cone#3 = 2。

 

相关

  • FeBrsub2/sub溴化亚铁,化学式FeBr2,棕黄色潮解固体,可溶于水。在室温下从水溶液中结晶出淡绿色的六水合物。温度升高时,也可结晶出四水合物和二水合物。400 °C时,在溴化氢气流中加热含水的
  • 曼哈顿原子弹计划曼哈顿计划(英语:Manhattan Project)是第二次世界大战期间研发与制造原子弹的一项大型军事工程,由美国主导、英国与加拿大提供相关支援,该计划于1942年至1946年间由美国陆军工程
  • 4年(希律王曾下令屠杀新生儿,希律在公元前4年去世,耶稣应在此年或之前出生。)
  • 浮游生物界远洋带指在内陆水域和海域中远离岸的自由水域。它指从水域中心起向靠岸方向直至遇到第一个有根的水生植物的区域。当其深度为0-200m是称之为透光带,其下为不透光带。远洋带同
  • 电影节列表本列表列出世界各地所举办的电影节。
  • 约翰·伊登约翰·伊登(德语:Johannes Itten,1888年11月11日-1967年3月25日),瑞士表现主义画家、设计师、教师、作家和理论家;与德裔美籍画家利奥尼·费宁格和德国雕塑家格哈德·马可斯,在德国
  • 列恩·维亚切斯拉夫维奇·卡尔宾斯基列恩·维亚切斯拉夫维奇·卡尔宾斯基(俄语:Лен Вячесла́вович Карпи́нский,1929年11月26日-1995年6月12日),苏联的政治家、公关人员。曾担任共青团书
  • 新汴河新汴河是淮河中游左岸的一条大型人工河道,开挖于20世纪60年代末,截流沱河、濉河上段来水直排入洪泽湖,具有防洪、排涝、灌溉、供水、航运等综合效益。因河线基本平行于隋炀帝开
  • 乔治·内森乔治·蒙塔格·内森(英语:George Montague Nathan,1895年1月20日-1937年7月16日)是西班牙国际纵队的英国志愿兵。
  • 下南势下南势,是台湾台南市东山区的一个传统地域名称,位于该区东南端。相较于今日行政区,其范围大致为南势里不含西部凸出部分的中段至北段。台湾日治初期,下南势地区为一(旧制)街庄,称为“下南势庄”,隶属于哆啰啯东顶堡。该庄北与崎仔头庄为邻,东边以陆界及曾文溪与后大埔庄为邻,东南隔曾文溪与密枝庄为界,南边为�莱宅庄、大坵园庄,西边为前大埔庄。1901年(日治明治三十四年)11月,全台设置二十厅,该庄隶属于盐水港厅。1903年(明治三十六年)6月,该庄编入“前大埔区”,隶属于盐水港厅。1909年(明治四十二年)10月,