自然语言理解

✍ dations ◷ 2025-05-12 04:38:27 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。

相关

  • 中世纪拉丁语中世纪拉丁语(英语:Medieval Latin)是在欧洲中世纪时期使用的拉丁语。它继承自后期拉丁语,从4-5世纪一直延续到约公元15世纪,才为文艺复兴拉丁语所取代。这一阶段拉丁语仍然是教
  • 古巴比伦巴比伦(阿拉伯语:بابل‎ Bābil;阿卡德语:Bābili(m);苏美尔语语标符号:KÁ.DINGIR.RAKI;希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-siz
  • 酯基.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-settings:
  • 阿尔萨斯人阿尔萨斯语(Elsässerditsch,意为“阿尔萨斯德语”),一种通行于法国阿尔萨斯地区的日耳曼语系方言,属于低地阿勒曼尼语,与德语密切相关,使用者人数超过70万。
  • MnO一氧化锰是锰的一种氧化物,化学式MnO,在自然界中以罕见的方锰矿(英语:manganosite)的形式存在。它在磁共振成像、电极材料制备等方面有着潜在应用。一氧化锰有着与氯化钠晶体相同
  • 钟万勰钟万勰(1934年2月24日-)计算力学专家,中国科学院院士,大连理工大学教授。著名电机工程学家钟兆琳之子。祖籍浙江德清,1934年出生于上海,早年就读于上海市南洋模范中学。1952年考入
  • 5-羟色胺转运体· protein binding · monoamine transmembrane transporter activity · serotonin transmembrane transporter activity · myosin binding · syntaxin-1 binding
  • 萨拉姆·法耶兹萨拉姆·法耶兹(1952年4月29日—),巴勒斯坦著名经济学家,曾任巴勒斯坦总理兼财政部长。1952年4月出生于约旦河西岸图勒凯尔姆地区,曾在贝鲁特美国大学获得理学学士学位,先后在美国
  • 生长激素 (消歧义)生长激素,可能是指:
  • 双标图双标图(Biplots)是一类统计学的统计图形。双标图可以同时把抽样和资料矩阵变量中的数据用图表表示出来。抽样样本可以用向量、线性轴和非线性轨迹表达。在类别变量的案例中,类