BabelNet

✍ dations ◷ 2025-10-10 23:21:24 #人工智能,计算语言学,知识表示,多语,在线词典,本体 (计算机科学)

BabelNet是一个多语词汇语义网络和本体,由罗马萨皮恩扎大学(罗马大学)计算机科学系的计算语言学实验室所创建。 BabelNet是自动构建的,其将最大的多语Web百科全书维基百科链接到最常用的英语计算词典WordNet。这种链接整合,以自动映射的方式完成;对于资源匮乏的语言所存在的词汇空缺,借助于统计机器翻译来补充。其结果是一个“百科词典”,提供了多种语言的概念和命名实体,并包含了它们之间的丰富的语义关系。通过与免费授权使用的OmegaWiki(英语:OmegaWiki)、英语维基词典、维基数据、FrameNet(英语:FrameNet)、VerbNet(英语:VerbNet)等语义资源建立链接,BabelNet还补充了其它一些词汇和定义。和WordNet类似,BabelNet将不同语言中的词语以同义词集的形式进行组织,称之为Babel synset。对于每一个Babel synset(英语:Synonym_ring),BabelNet提供简短的定义(称为注释),这些定义具有多种语言版本,主要来自于WordNet和维基百科。

截至2016年8月,BabelNet(v3.7)已覆盖了271种语言,包栝全部的欧洲语言、大多数亚洲语言及拉丁语。BabelNet 3.7包含了大约1400万个同义词集和7.46亿个词义(不论其语言)。在每种语言中,每个Babel synset(词义)平均包含2个同义词。BabelNet的语义网络包含了丰富的词汇语义关系。这些语义关系有两个来源:一是,来自于WordNet的语义关系,如上下位关系(英语:Hyponymy_and_hypernymy)、部分整体关系、反义、同义关系等,总共大约36.4万条关系;二是,来自于维基百科的非特定的相关关系,总共大约3.8亿条关系。 BabelNet 3.7将大约1100万张图片与Babel synset建立了关联,并为这些资源提供了Lemon RDF编码,可通过SPARQL endpoint获取。BabelNet 3.7为267万个同义词集指定了领域标签。

BabelNet可广泛应用在多语自然语言处理中。BabelNet中的词汇化知识可在以下任务中取得最佳效果:

BabelNet是一个多语词汇语义网络和本体,因其在克服语言障碍和利用异构数据源方面做了巨大的开创性工作,BabelNet于2015年被授予META奖。

BabelNet是最新的词汇知识资源库,具有巨大创新性,《时代周刊》曾专题报道BabelNet的研究工作,认为BabelNet将在21世纪发挥引领作用。

相关

  • 白垩纪白.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-setting
  • 胱胺酸症胱氨酸症(英语:Cystinosis)是溶小体贮积症的一种,因第17对染色体短臂13位置的CTNS基因发生缺损,导致将胱氨酸携出溶小体的运输酶功能异常,胱氨酸堆积溶小体上,进而造成器官的病变。
  • 全内反射荧光显微镜(TIRF)全内反射荧光显微镜(total internal reflection fluorescent microscope,TIRFM),利用光线全反射后在介质另一面产生衰逝波的特性,激发荧光分子以观察荧光标定样品的极薄区域,观测
  • 西班牙国王这是一份西班牙君主的列表。严格来说,是现代定义下统一的西班牙的君主列表,此前在现今西班牙乃至葡萄牙领土上的君主国统治者,请参看下面的列表:上述各系王室,最终在亚拉冈国王费
  • 溴酸盐溴酸盐是溴酸形成的盐类,含有三角锥型的溴酸根离子—BrO3−,其中溴的氧化态为+5。溴酸盐的例子有:溴酸盐可由臭氧氧化溴离子得到,净反应为:用阳极、二氧化氯等氧化剂氧化溴离子时
  • 伪数学伪数学(Pseudomathematics)是一种由非数学家所进行的、类似数学之活动形式——且数学家自己也会偶尔这么做。这个词是从伪科学一词(也就是那些被声称是科学但其实并不是科学的
  • 翁东翁东(印尼语:Untung Syamsuri;1926年7月3日-1967年9月)中校,是印度尼西亚在1965年的九三〇事件中发动政变未遂的领导人之一。作为一名职业军人,翁东是由苏哈托于1962年派往西新几内
  • 包气带包气带(Vadose zone),或称渗流带,是指位于地球表面以下、潜水面以上的地质介质。有时人们也把包气带称为非饱和区(unsaturated zone),但是这两个概念的含义不完全相同。非饱和区
  • 新潟县第2区新潟县第2区是日本众议院的选区,设立于1994年。北海道 13 | 山形县 4 | 静冈县 9 | 岛根县 3 | 大分县 4福井县 3 | 山梨县 3 | 德岛县 3 | 高知县 3 | 佐贺县 3青森县 4 |
  • 约翰·克罗森约翰·克罗森(John Dominic Crossan,1934-),爱尔兰裔美国人,著名新约圣经学者,耶稣研究会创办人之一。克罗森出生于爱尔兰蒂珀雷里。1950年加入天主教圣母忠仆会,后来到美国。1957年