首页 >
自然语言理解
✍ dations ◷ 2025-08-29 10:15:05 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。
相关
- 埃莉诺·罗斯福安娜·埃莉诺·罗斯福(英语:Anna Eleanor Roosevelt,/ˈɛlᵻnɔːr ˈroʊzəvɛlt/,1884年10月11日-1962年11月7日)是一位美国政治人物。第32任美国总统富兰克林·德拉诺·罗斯
- 强碱在各种酸碱理论中,碱都是指与酸相对的一类物质。碱多指碱金属及碱土金属的氢氧化物,而对碱最常见的定义是根据阿伦尼乌斯(Arrhenius)提出的酸碱离子理论作出的定义:碱是一种在水
- 世界卫生组织基本药物标准清单世界卫生组织基本药物标准清单(法语:Listes modèles OMS des médicaments essentiels;英语:WHO Model List of Essential Medicines;简称EML)是世界卫生组织(WHO或称世卫组织)的出
- 糖尿世界糖尿病日代表符号“包 圈”(Universal blue circle symbol for diabetes.)糖尿病(拉丁语:diabetes mellitus,缩写为DM,简称diabetes)是一种代谢性疾病,它的特征是患者的血糖长
- 处方缩写词列表处方缩写词列表是医学处方中常用的基于拉丁文术语的词头缩写。其中的大写、句点'.'的使用是可选的版式风格。列表中不包含处方中常见的药品的缩写。列表中红色条目是在美国
- 滤泡刺激素促卵泡激素(英语:follicle-stimulating hormone, FSH,亦称为卵泡刺激素)是一种由脑垂体合成并分泌的激素,属于糖基化蛋白质激素,因最早发现其对女性卵泡成熟的刺激作用而得名。后
- 阿卜杜拉赫曼·瓦希德阿卜杜拉赫曼·瓦希德(印尼语:Abdurrahman Wahid( 读音 帮助·信息,1940年9月7日-2009年12月30日),华语姓氏陈 印度尼西亚政治家,盲人政治家,民族觉醒党创立者,曾任印度尼西亚总统(199
- 碳粉墨粉或碳粉(toner)是激光打印机或复印机上用于使纸张着色的物质,主要成分为碳、氧化铁和树脂。墨粉由大小约为8-10微米的颗粒组成。
- 吸墨纸吸墨纸(Blotting paper)、吸墨水纸,有时也称为吸水纸(bibulous paper)如显微镜学,是用来吸收过量的液体(如墨水、油)的纸。通常用化学木浆或棉布浆制成。纸质粗松、吸水性强。
- 分手信《分手信》(英语:Dear John)是一部2010年上映的美国电影,改编自小说《分手信》。本片由莱塞·霍尔斯道姆执导,主要演员有查宁·塔图姆、阿曼达·西耶弗里德、斯科特·波特,北美地