首页 >
自然语言理解
✍ dations ◷ 2025-02-23 14:10:17 #自然语言理解
自然语言理解是研究如何让电脑读懂人类语言的一门技术,是自然语言处理技术中最困难的一项。自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本,但是比起结构固定的数据库之查询,要处理的词汇以及句法更广更多样。自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制,但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂,但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表(英语:lexicon)、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力。系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍。理论从“素朴语义学(英语:naive semantics)”或 “随机语义分析(英语:stochastic semantic analysis)”到利用“语用学”从上下文得出意涵。自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处。
相关
- HCG试验hCG试验(hCG pregnancy strip test)是利用检验人绒毛膜促性腺激素的方式,判断是否有怀孕的试验(妊娠试验) 。hCG(人绒毛膜促性腺激素)是胚胎受精后立刻就会分泌的激素,之后也会由胎
- 剪刀差剪刀差(price scissors)指工农业产品交换时,工业品价格高于价值,农产品价格低于价值所出现的差额。剪刀差是发达国家在国际贸易中的一种重要交换手段之一。 它是体现在以掌握高
- 颚脊椎动物有颔下门(Gnathostomata)原为有颔总纲(Gnatha),是脊椎动物亚门中拥有颔的一群,与无颔总纲相对应,属于较高等的一类。有颔下门生物之下颌骨系于距今约四亿三千万年前开始发展形成,即
- 心心可以指:
- 肽链延伸原核翻译(Prokaryotic translation)是指原核生物细胞中信使RNA被70S核糖体翻译为蛋白质的过程。该过程可分为起始、延伸、终止与再循环四个主要步骤。原核生物的翻译起始阶段
- 辣椒酱辣酱(英语:Hot sauce),泛指各种以辛辣香料制成的辣味酱汁,其中以辣椒制成的辣椒酱最普遍,其它辣酱原料如芥菜种子可制成芥末酱,还有山葵、辣根、胡椒等各类原料。辣椒酱中的辣味来
- 民航管理部门本列表列出了国家地区与跨国民用航空管理部门(civil aviation authorities)飞行员(机长 · 副机师 · 二副机师 · 三副机师)空服员(舱务长(英语:Purser#Aircraft) · 乘务员)飞行场
- 丝氨酸蛋白酶类/丝氨酸内肽酶类丝氨酸蛋白酶是一个蛋白酶家族,它们的作用是断裂大分子蛋白质中的肽键,使之成为小分子蛋白质。其激活是通过活性中心一组氨基酸残基变化实现的,它们之中一定有一个是丝氨酸(其名
- 丹麦城市列表以下为主要丹麦城市列表:1 = 所有人口超过20,000的城市 2 = Ølstykke-Stenløse is a new city, created by conurbation between Ølstykke and Stenløse on 2010-01-01.
- 塞巴斯蒂安·维特尔241( 240次起步)塞巴斯蒂安·维特尔(德语:Sebastian Vettel,1987年7月3日-),是一位德国一级方程式赛车车手,目前效力于法拉利车队。他是四届的一级方程式赛车世界冠军,在2010年、2011