自然语言理解

✍ dations ◷ 2024-11-05 17:27:13 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。

相关

  • 口腔颌面外科口腔颌面外科(英语:Oral and Maxillofacial Surgery)是一个现代医疗的外科,该外科主要治理头部、颈部、脸部、下颌、口腔和颌面部位,包括软组织和硬组织的损伤和疾病,并通过药物及
  • 分子量分子量,又称“相对分子质量”,指组成分子的所有原子的原子量的总和,分子量的符号为Mr。定义为物质分子或特定单元的平均质量与12C质量的1/12之比值。由于是相对值,所以为无量纲
  • 斯巴达坐标:37°4′55″N 22°25′25″E / 37.08194°N 22.42361°E / 37.08194; 22.42361斯巴达(希腊语:Σπάρτη,英语:Sparta),城邦本身名为拉刻代蒙(Λακεδαίμων, Lakeda
  • 特征文字特征文字是指这样一类文字:它的字符的形状不是任意的,而是会将其所表示的音素的语音特征编入其形状之中。特征一词由英国人杰弗里·桑普森(Geoffrey Sampson)为描述朝鲜语中的谚
  • 世界足球先生国际足联世界足球先生(FIFA World Player of the Year),是由国际足联评选的年度最佳足球运动员荣誉,由各国国家队的主教练投票产生。每位投票的教练分别可以投三张选票,分别为5分
  • 埃里克·萨蒂埃里克·阿尔弗雷德·莱斯利·萨蒂(法语:Éric Alfred Leslie Satie,1866年5月17日-1925年7月1日),后来自己改名为Erik Satie,法国作曲家。他被法国音乐团体“六人团”尊为导师,是二
  • 厌烦在日常的语境中,厌烦是指一种情绪和偶尔的心理状态,当一个人没有任何特别的事情要做,对他周围的环境不感兴趣,或觉得一天或一段时间比较无聊或乏味的时候会有厌烦这种情绪。现代
  • 正一道正一道是宋、元朝形成的道教宗派,来自于汉朝的五斗米道。全称作“正一盟威之道”,奉张天师为首领,道术以画符念咒为主,道士一般娶妻生子,不必出家。按金允中《上清灵宝大法》的记
  • abbr class=abbr title=R60: 可能损害生育能力R60/abbr警示性质标准词(英语:Risk Phrases,简写:R-phrases)是于《欧联指导标准67/548/EEC 附录III: 有关危险物品与其储备的特殊风险性质》里定义。该列表被集中并再出版于指导标准2001/
  • 照相摄影(英语:photography)是指使用某种专门设备进行影像记录的过程。一般我们使用机械照相机或者数码照相机进行静态图片摄影,静态摄影也会被称为照相。而摄影机(摄像放像机)则可以