命名实体识别

✍ dations ◷ 2024-12-22 22:29:08 #命名实体识别
命名实体识别(英语:Named Entity Recognition,简称NER),又称作专名识别、命名实体,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等,以及时间、数量、货币、比例数值等文字。指的是可以用专有名词(名称)标识的事物,一个命名实体一般代表唯一一个具体事物个体,包括人名、地名等。NER属于从非结构化文本中分类和定位命名实体感情的子任务,其过程是从是非结构化文本表达式中产生专有名词标注信息的命名实体表达式,目前NER有两个显著的问题,即识别和分类。例如,“奥巴马是美国总统”的“奥巴马”和“美国”都代表一个具体事物,因此都是命名实体。而“总统”不代表一个具体事物,因此不是命名实体。

相关

  • 心肌炎心肌炎(拉丁语:Myocarditis),也称为炎症性心肌病(Inflammatory Cardiomyopathy),是心肌的炎症。症状可表现为呼吸困难、胸口疼痛(英语:chest pain)、运动能力降低、心律不整等。发病时
  • 泮托拉唑泮托拉唑(英语:Pantoprazole,常用商品名有:Somac、Tecta、Pantoloc、Controloc、Panprax、Pansiv、Protium、Prazolin、Protonix、Pantecta、Pantoheal、Pantpas、Ppi-40以及Neo
  • 体液体液(Body fluid),包括血液、脑脊髓液、胃液、消化液、精液、唾液、泪液、汗液、尿液、阴道分泌液等。在有疾病的状态下,也会产生一些平常量少不易侦测到的体液,如肋膜积液(又称胸
  • 法兰克-史达林机制Frank–Starling机制(英语:Frank–Starling mechanisms),是心脏的一种代偿机制。指的是心脏的每搏输出量在所有其他因素保持不变的情况下,会随着心脏前负荷(心肌在收缩前所承受的
  • 杰森·贝克杰森·伊莱·贝克(英语:Jason Eli Becker,1969年7月22日-)是一名美国新古典主义重金属吉他演奏家、作曲家。目前一边继续从音乐创作活动一边与肌萎缩性脊髓侧索硬化症搏斗。杰森
  • 优养化优养化(英语:Eutrophication),又称作富营养化,是指湖泊、河流、水库等水体中氮、磷等植物营养物质含量过多所引起的水质污染现象。由于水体中氮、磷营养物质的富集,引起藻类及其他
  • 高尔夫球场高尔夫球场(英文:Golf course)是进行高尔夫球运动时所需的场地。一个标准的高尔夫球场包括18个洞(Hole)。有的高尔夫球场仅有9个洞,也有的有27或36个洞。每个洞都有规定的杆数,称为
  • 布拉克詹姆士·怀特·布拉克爵士,OM,FRS,FRSE,FRCP(英语:Sir James Whyte Black,1924年6月14日-2010年3月22日),苏格兰药理学家,发明药物Propranolol和合成出Cimetidine。他因这些成就而在198
  • font style=color:#888small楚汉争霸 前206–前202/small/font西楚(前206年–前202年)为秦朝灭亡至汉朝建立之间的政权,主君为项羽,定都彭城,统楚、梁及鲁国旧邑九郡等战国时的楚国旧地,国号“西楚”。(史籍中并无“楚”之称,《史记·项羽本纪》
  • 分散体系分散系是将一种或一种以上的物质分散到另一种物质所形成的混合体系。前一种物质称为分散相,后一种物质称为分散介质。按照分散质微粒大小,分散系可分为三种: