自然语言理解

✍ dations ◷ 2025-09-18 15:54:57 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。

相关

  • 表面活性剂表面活性剂(又称界面活性剂)是能使目标溶液表面张力显著下降的物质,可降低两种液体或液体-固体间的表面张力。最典型的例子是肥皂,具分解、渗入的效果,应用广泛。表面活性剂一般
  • 加洛林帝国加洛林帝国 (800–888) 是中世纪早期欧洲西部和中部的帝国。加洛林帝国被加洛林王朝统治,加洛林家族从751年开始成为法兰克国王,774年开始成为意大利伦巴底国王。800年,法兰克
  • 楔形软骨楔状软骨(cuneiform cartilages;cunei- 源于拉丁语:cunei(楔形);亦称为里斯伯格(英语:Heinrich August Wrisberg)软骨、楔形软骨;楔 (cuneiform)/xiē(ㄒㄧㄝˉ))在人类喉部中是两个小
  • 佐贺大学佐贺大学(日语:佐賀大学/さがだいがく),位于佐贺县的日本国立大学。由旧制佐贺高等学校、佐贺师范学校、佐贺青年师范学校在1949年合并而成。
  • 水韭目水韭属(学名:Isoëtes),多年生挺水植物或沉水植物,高从5公分到15公分都有。叶子通常呈现丛生状,暗色且繁衍用的孢子密生于叶基内侧。一般来说,该种植物都生长在湖沼湿地。据记录,全
  • 碧海蓝天《碧海蓝天》(法语:Le Grand Bleu),是法国电影导演卢·贝松于1988年完成与首映的经典作品。情节讲述法国知名潜者贾克马攸(Jacques Mayol)的故事,但多为虚构情节。其风格有别于新浪
  • 光放大器光放大器是光纤通信系统中能对光信号进行放大的一种子系统产品。光放大器的原理基本上是基于激光的受激辐射,通过将泵浦光的能量转变为信号光的能量实现放大作用。光放大器自
  • 云孙孙是指子女的子女,男性称孙儿或孙子,女性称孙女。在父系社会,儿子的子女称为“内孙”或者“孙”,女儿的子女称为“外孙”。而自己的孙或外孙就称自己为祖父母或外祖父母。另外,闽
  • 小港庄小港庄,为1920年-1945年间存在之行政区,辖属高雄州凤山郡。今高雄市小港区。1934年时约有人口15,540人。1920年,台湾总督府原订名“港子庄”,后改为小港庄,原因是“子”、“小”两
  • 中西区中西区可以指: