自然语言理解

✍ dations ◷ 2025-10-12 04:12:11 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。

相关

  • APP1AAP, 1AMB, 1AMC, 1AML, 1BA4, 1BA6, 1BJB, 1BJC, 1BRC, 1CA0, 1HZ3, 1IYT, 1MWP, 1OWT, 1QCM, 1QWP, 1QXC, 1QYT, 1TAW, 1TKN, 1UO7, 1UO8, 1UOA, 1UOI, 1X11, 1Z0Q, 1ZE7
  • Anterior ethmoidal前筛神经(anterior ethmoidal nerve)为支配鼻腔感觉的神经。该神经源自于鼻睫神经(英语:nasociliary nerve),为三叉神经眼分支的其中一条分支。鼻睫神经在分支出四个分支(由起点到
  • 心脏骤停心脏停止(Cardiac arrest)或称为心搏停止,是心脏因不能够有效收缩,而导致血液循环停止的现象,症状包含丧失意识(英语:Unconsciousness)、呼吸异常或中止(英语:respiratory arrest),有些
  • 后期重轰击期后期重轰炸期,又称晚期重轰炸,是指约于41亿年前至38亿年前,即于地球地质年代中的冥古宙及太古宙前后,推断在月球上发生不成比例的大量小行星撞击的事件,在地球、水星、金星及火星
  • span class=chemf style=white-space:nowrap;Csub16/sub十六烷(英语:hexadecane、cetane)是化学式为C16H34的烷烃。十六烷由16个碳原子直链组成,头和尾被3个氢原子连着,中间2个。十六烷值用以量度柴油的易燃性。在压缩下,十六烷非常易燃
  • 民事互助契约法国民事互助契约(法语:Pacte civil de solidarité;法语缩写:PACS。中文又译:“紧密关系民事协议”、“民事连带契约”等)是法国除婚姻之外的另一种民事结合方式。不管异性还是同
  • 统治贞观遗风,是指在唐太宗之后的时期,亦即唐高宗及武则天的五十六年统治时期(649-705年),继续维持贞观之治的开明政治局面,并为后来唐玄宗的开元之治奠定基础。《资治通鉴》认为唐高
  • 新英格兰革命新英格兰革命(英文:New England Revolution)是美国职业足球大联盟足球队,位于马萨诸塞州福克斯堡。球队主席是罗伯特·卡夫,他同时拥有国家美式足球联盟球队新英格兰爱国者。主场
  • 茂林国家风景区坐标:22°45′08″N 120°38′07″E / 22.7522086°N 120.6353354°E / 22.7522086; 120.6353354 茂林国家风景区位于台湾高雄市与屏东县交界处。辖区南北狭长,地处中央山脉尾
  • 杉木属(学名:Cunninghamia)是柏科下的一个属,为常绿乔木植物。该属现存有杉木(C. lanceolata)一种,与其的变种台湾杉木(C. l. var. konishii),分布于越南和中国秦岭以南及台湾。