指代

✍ dations ◷ 2025-04-25 01:25:28 #指代
指代(coreference)为语言学中为了避免已经出现的字词重复出现在文章的句子上,导致语句结构过于赘述和语意不够清晰,所以使用代词(pronouns)或是普通名词(common nouns)来代替已经出现过的字词谓之。举例: .mw-parser-output .templatequote{margin-top:0;overflow:hidden}.mw-parser-output .templatequote .templatequotecite{line-height:1em;text-align:left;padding-left:2em;margin-top:0}.mw-parser-output .templatequote .templatequotecite cite{font-size:small}The handsome boy stared at Mary and said nothing: he seemed offended by her manner.此处的"The handsome boy"与"he"意指为同一人;"Mary"与"her"意指为另同一人。在计算语言学中,指代消解(Coreference Resolution)是一个很重要的议题,一般被应用于处理资讯检索中的前处理部分,主要是找回原先被替换过的字词,为了避免重要的字词因指代的因素而造成权重计算降低的问题,例如:以中文维基百科中的北极熊条目为例,如下所示,由于指代的因素,其文中原为北极熊之意的字词会被代换成白熊、熊、它和肉食动物等等的字眼,如此的表示方式,在权重计算上会产生因为北极熊此字词出现次数过于稀少,而导致资讯检索系统误判为不是描述北极熊文件,因此,透过指代消解的处理,可以将被替换过的字词还原成原有的意思,以提高权重计算的次数,增加检索的正确性。- 北极熊又称白熊,是在北极里生长的熊,它是陆上最庞大的肉食动物。在它生存的空间里,它是食物链最顶层。它拥有极厚的脂肪及毛发来保暖,其白色的外表在雪白的雪地上是良好的保护色,而且它可以在陆上及海上捕捉食物,因此它能在北极这种极严酷的气候里生存。

相关

  • 型态学是技术分析中重要的一环,最早可追溯至道氏理论。主要记录价格的变动,并将其转换成图表显示。由于目标测量的关系,使技术分析的支持者喜欢采用。根据所在位置,分成两大类:根据形状
  • 放射药物放射药理学是关于研究和制备放射性药物的一门学科。在疾病的诊断与治疗当中,核医学领域将放射性药物作为示踪剂来使用。其中,许多放射性药物采用的都是锝(Tc-99m)。在Klaus Schw
  • DNA序列核酸序列(英语:Nucleic acid sequence,亦称为核酸的一级结构)使用一串字母表示的真实的或者假设的携带基因信息的DNA分子的一级结构。每个字母代表一种核碱基,两个碱基形成一个碱
  • C05AAA·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码C05(血管保护药)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collabor
  • 大卫王大卫(希伯来语:דָּוִד‎,阿拉伯语:داود‎,其他音译:达味/天主教,多惠圣王或多惠法王/景教,达乌德/伊斯兰教,大辟/旧译),是公元前10世纪以色列联合王国的第二任国王。大卫乃“被爱
  • 树皮树皮是木质植物,例如树的茎和根最外面的部分。狭义的树皮包括三层:木栓、木栓形成层和栓内层,以及外部的各种死组织,广义的树皮还包括韧皮部。有的植物的树皮中含有各种生物碱、
  • 核素核素(英语:Nuclide)是具有特定原子量、原子序数和核能态,且平均寿命长得足以被观察到的一类原子。它是带有原子中的电子云的某类特殊原子核,以其质量数、中子数以及核的能态为标
  • 锡-121m1锡-121m1(也写作“121m1Sn”)是锡元素的一种放射性同位素及同质异能素,具有约43.9年的半衰期。在普通热核反应堆中,它的裂变产物产额很低,因此这种同位素只占核废料的极小部分。
  • 鸟类分类系统2014年,基于全基因组测序的鸟类分类系统公布,目前已经取代1980年代的鸟类DNA分类系统并广泛使用。今颚下纲各主要演化支的亲缘关系如下: .mw-parser-output table.clade{border
  • 卡车载货汽车,小型的通常称货车,大型的称做卡车。指主要用于运送货物的汽车,有时也指可以牵引其他车辆的汽车,属于商用车辆类别。一般可依造车的重量分为重型和轻型两种。绝大部分货