自然语言理解

✍ dations ◷ 2024-12-22 18:56:35 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。

相关

  • 巴巴拉·麦克林托克芭芭拉·麦克林托克(英语:Barbara McClintock,1902年6月16日-1992年9月2日),美国著名女性细胞遗传学家。1983年获得诺贝尔生理学或医学奖,是首位没有共同得奖者、单独获得该奖项的
  • 亚伊采坐标:44°20′24.91″N 17°15′26.04″E / 44.3402528°N 17.2572333°E / 44.3402528; 17.2572333亚伊采(波斯尼亚语:Jajce、克罗地亚语:Jajce、塞尔维亚语:Јајце)是波斯尼
  • 奥托二世奥托二世(Otto II,955年—983年12月7日),东法兰克国王(961年—983年在位),罗马帝国皇帝(967年起与父亲共治)。皇帝奥托一世与伦巴第的阿德莱德之子。奥托二世在961年父皇尚在世时即已
  • 联氨、联胺、二氮烷或.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{fo
  • 蛇形冷凝管蛇形冷凝管是实验室中常用在蒸馏、分馏与回流过程中,与直型冷凝管用途相似。将热气态分子借由与冷水管面接触使其温度降至沸点以下,凝结成为液态。再顺势延著内管向下流出,并加
  • 美国联邦航空总署美国联邦航空管理局(英语:Federal Aviation Administration,缩写:FAA)是美国运输部下属、负责民用航空管理的机构;其管辖范围包括机场的建设与运行、航空交通管制、飞行员及飞机资
  • 麝鹿麝,俗称香獐,在有角下目是现存最原始的科,种类少,无角,雄性有发达獠牙。麝属中有七个种,包括原麝、林麝、黑麝、喜马拉雅麝、安徽麝(原被认为是林麝的亚种)。、白腹麝(也常被称为喜玛
  • 妙翅迦楼罗(梵语:गरुड,转写:Garuḍa;巴利语:Garuḷa),又音译作揭路荼、迦娄罗、蘗噜拏、羯路荼、迦留罗、迦喽荼,伽楼罗、誐噜拏,汉译大鹏金翅鸟、金翅鸟、妙翅鸟、大鹏仙,原是印度神话
  • 社会进步实证主义 · 反实证主义(英语:Antipositivism) 结构主义 · 冲突理论 中层理论 · 形式理论 批判理论人口 · 团体 · 组织(英语:Organizational theory) · 社会化 社会性
  • 多发性硬化病多发性硬化症(Multiple sclerosis,MS)是一种脱髓鞘性神经病变(英语:demyelinating disease),患者脑或脊髓中的神经细胞表面的绝缘物质(即髓鞘)受到破坏,神经系统的信号转导受损,导致一