首页 >
自然语言理解
✍ dations ◷ 2025-11-26 14:40:59 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。
相关
- 犹他州犹他州(英语:State of Utah)是美国西部的一个州。于1896年1月4日成为美国第45个州。犹他州是美国13大的州、人口排行33和人口密度倒数第10名的州。犹他州行政区划一共有29个县
- 同化同化作用,又称为合成代谢,是指生物体利用能量将小分子合成为大分子的一系列代谢途径。这些反应需要能量,也被称为吸能过程(endergonic process)。将代谢过程分类的一种方式,无论是
- 克拉斯诺达尔边疆区克拉斯诺达尔边疆区(俄语:Краснода́рский край,罗马化:Krasnodarskiy kray),位于前高加索西部、大高加索北麓,亚速海—黑海东岸,与克里米亚隔刻赤海峡相望。南面
- 语域语域(Register)是在特定语言使用的场合或领域所使用的语言变体风格。根据英国语言学家韩礼德(M. A. K. Halliday)的定义,语域是可以按照用途区分的语言变体。语言使用的领域的种
- 美国政党列表这个美国政党列表包含了以前和目前存在于美国政治的政党。Current United States Congressional seatsCongressional leadership of the House of RepresentativesCongressi
- 凯特勒凯特勒(Lambert Adolphe Jacques Quetelet,1796年-1874年),19世纪比利时的通才,他既是统计学家、又是数学家和天文学家。他从统计学角度出发看人,认为人的成长是会依从一套既定的法
- 多能性细胞潜能(Cell potency)是指一个细胞可以分化为其他种细胞的能力。一般来说,一种细胞可以分化成越多种不同类型的细胞,就可以认为这种细胞的细胞潜能越大。细胞潜能从大到小可以
- 2-乙基-1-丁醇2-乙基-1-丁醇(英语:2-Ethyl-1-butanol,IUPAC名:2-ethylbutan-1-ol)是一种有机化合物,它可以与乙醇形成共沸物来使其与水分离。2-乙基-1-丁醇的工业合成起始于乙醛和丁醛发生羟醛
- 艾杜醇艾杜醇 或 艾杜糖醇(英语:Iditol)是一种糖醇。半乳糖激酶缺乏症(英语:galactokinase deficiency)会导致艾杜醇的积累。尿苷二磷酸半乳糖 · 尿苷二磷酸葡萄糖医学导航:遗传代谢缺
- 集水区集水区是收集水的自然流域或人为的集水设计、结构,计算集水区面积用于河谷、盆地、分水岭在灌溉测算和洪灾的防治方面,为不可忽视的要素。当雨水从天空中掉落到地面时,有一部分
