首页 >
自然语言理解
✍ dations ◷ 2025-01-23 12:18:29 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。
相关
- 飞行员飞行员(英语:pilot)或称飞机师。是指出于职业或非盈利性需要(例如:娱乐)驾驶航空器的人员。在民用航空领域,除满足特定要求的情况外,各国民航当局一般都要求航空器驾驶员需持有相应
- 记忆树记忆树是利用关联性记忆法,有效的将大量的资料整理并且快速的在脑中留下印象,特色是会以一个主题当作是主干,与其相关联的资料会采上下半辐射状依序连结出,呈现出类似树状图的图
- 49,XYYYYXYYYY综合征(英语:XYYYY syndrome),是一种罕见的Y染色体数目异常疾病。中度至重度智能障碍、言语延迟、肌张力低、巨脑室、脑白质异常、脊柱侧弯、复发性上呼吸道感染、肘外翻、
- STAT61OJ5· sequence-specific DNA binding transcription factor activity · signal transducer activity · calcium ion binding · protein binding· nucleus · nucl
- 蜕皮在生物学中,蜕皮,又称脱皮,或者对许多无脊椎动物来说也称为脱壳,是动物的一种惯常行为,它们将身体的一部分(通常是外层或壳,但并不总是如此)换掉,或是在特定的季节,或是在其生命周期中
- 储蓄率各国储蓄列表的数据来源于美国中央情报局,储蓄率是指国民储蓄的总金额除以当年GDP,国民储蓄是可支配总收入减去总消费,包含个人储蓄、商业储蓄以及政府储蓄,但不包含外国储蓄,以
- 布特罗斯·加利布特罗斯·布特罗斯-加利(阿拉伯语:بطرس بطرس غالي,拉丁化:Buṭrus Buṭrus-Gālī,1922年11月14日-2016年2月16日),联合国第六任秘书长(1992年1月—1996年12月)。布特
- 德古斯加巴特古西加尔巴(西班牙语:Tegucigalpa)是洪都拉斯的首都及第一大城,人口894,000(2006年),位在洪都拉斯中部,名为特古西加尔巴的山谷中,海拔975米。该名的意思是“银色的山”。特古西加
- 中国话剧话剧指以对话为主的戏剧形式。话剧虽然可以使用少量音乐、歌唱等,但主要叙述手段为演员在台上无伴奏的对白或独白。中国传统戏剧均不属于话剧,一些西方传统戏剧如古希腊戏剧因
- ɑ开后不圆唇元音是母音的一种,用于一些语言当中,国际音标以⟨ɑ⟩代表此音,而X-SAMPA音标则以⟨A⟩代表此音。⟨ɑ⟩这符号又称作“手写体a”,因为它缺乏“印刷体a”(就是⟨a⟩)顶