首页 >
自然语言理解
✍ dations ◷ 2025-06-07 06:00:21 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。
相关
- 体重体重指的是人体(有时也指动物体)的质量,严格地说不是重量。常见衡量单位为千克、斤、磅等。是在医学、人体测量学、考古学和体育方面的有用参数。目前医学上认为,新生儿体重的正
- 996工作制996工作制,是指一种“早上9点上班,晚上9点下班,每周工作6天”的用工制度,有时也被用来指代一系列资方要求劳方延长工时而不额外给薪的工作制度。最初多因网络及软件行业的员工交
- 额窦额窦位于眉弓,极少对称,且在其之间的鼻中隔也时常会遍向中线的某一侧。额窦平均的尺寸如下:长 3 公分、宽 2.5 公分、厚 2.5 公分。各个额窦都会经由穿过筛骨迷路前端的额鼻管
- 家畜胚胎学家畜胚胎学是胚胎学的一支,为研究家畜和家禽的胚胎的机理产生发展的学科。其研究范围包括家畜家禽是从受精到分娩或孵出之前,胚胎子宫或卵膜发育的过程。
- 阿德勒阿德勒可以指:
- 斯托克斯黏度(英语:Viscosity),是黏性的程度,是材料的首要功能,也称动力粘度、粘(滞)性系数、内摩擦系数。不同物质的黏度不同,例如在室温(25℃)及常压(1巴)下,空气的黏度为18.5μPa·s,大约比在相
- 亚变种在植物分类学中,变种(拉丁文:varietas,简称写做 var.)为一种分类级别,位于种与亚种之下、变型(英语:Form (botany))之上;作为种下分类群,生物学名会采用三名法。有一种枕形仙人掌“Esco
- 中华电信股份有限公司中华电信,简称中华电、CHT,是台湾的电信运营商之一,于1996年由交通部电信总局的营运部门分拆(英语:Corporate spin-off)及公司化(英语:Corporatization)而来,业务范围涵盖固网电信、行
- 量纲量纲,又叫作因次(Fundamental unit),是表示一个物理量由基本量组成的情况。确定若干个基本量后,每个导出量都可以表示为基本量的幂的乘积的形式。引入量纲这一概念可以进行量纲分
- 抽搐 (消歧义)抽搐(抽动;颤动;Twitch)可能指的是: