自然语言理解

✍ dations ◷ 2025-04-03 10:53:13 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。

相关

  • BNA阿根廷“马里亚诺·莫雷诺”国家图书馆(西班牙语:Biblioteca Nacional "Mariano Moreno" de la República Argentina),是阿根廷的国家图书馆,同时也是阿根廷最大的图书馆,图书馆
  • 格涅兹诺坐标:52°33′N 17°36′E / 52.550°N 17.600°E / 52.550; 17.600格涅兹诺(波兰语:Gniezno)是波兰中西部城镇,在波兹南以东约50公里处。该城从1999年起属大波兰省(以前属波兹南
  • 华冈青洲华冈青洲(1760年11月30日-1835年11月21日),名震,字伯行,又名云平,号青洲、随贤。日本江户时代末期著名汉医学者、外科医生,出生于幕府末期纪州(和歌山县)的杰出人物。是全世界首位使用
  • 标准大气压标准大气压是压强的一种非国际单位制单位,单位符号atm。其具体数值有不同的定义。标准大气压一般定义为101.325kPa。国际民航组织、国际标准化组织等组织使用这一数值。在195
  • 原噬菌体原噬菌体(英语:prophage)为一种原病毒基因,可被插入或是聚集在环状病毒DNA染色体中,或是以染色体外的质体形式存在。这是一种潜在的病毒型态,在细菌中病毒以此种形态存在,但不会瓦
  • 氧化钾氧化钾是由钾和氧组成的无机化合物。它通常以过氧化钾和钾的归中反应制备:或钾还原硝酸钾:氧化钾和水的反应剧烈,会迅速反应为氢氧化钾:它会在空气中潮解。因此它对人体有腐蚀性
  • 大波士顿地区大波士顿是指马萨诸塞州紧靠波士顿的地区。都会区总人口约440万,列美国第11位。人口普查办公室按照美国行政管理和预算局的基于核心的统计区域(英语:Core Based Statistical Ar
  • 地源热泵系统可持续发展主题可再生能源主题环境主题地源热泵系统以岩土体、地下水或地表水为低温热源,由水源热泵机组、地热能交换系统、建筑物内系统组成的供热空调系统。根据地热能交换
  • 天道教天道教是朝鲜半岛的一个新兴宗教。天道教的前身是由崔济愚创立的东学。朝鲜王朝末期,1860年代的朝鲜王朝处于西方势力的威胁之下,崔济愚担心朝鲜传统的宗教将被天主教代替,综合
  • 马尔代夫中华民国与马尔代夫关系是指中华民国与马尔代夫共和国之间的关系。两国于1966-1972年有官方外交关系,断交后,目前没有在对方首都互设具大使馆性质的代表机构。对马尔代夫的相关