首页 >
机械翻译
✍ dations ◷ 2025-07-19 00:05:43 #机械翻译
机器翻译(英语:Machine Translation,经常简写为MT,简称机译或机翻)属于计算语言学的范畴,其研究借由计算机程序将文字或演说从一种自然语言翻译成另一种自然语言。简单来说,机器翻译是通过将一个自然语言的字辞取代成另一个自然语言的字辞。借由使用语料库的技术,可达成更加复杂的自动翻译,包含可更佳的处理不同的文法结构、辞汇辨识、惯用语的对应等。目前的机器翻译软件通常可允许针对特定领域或是专业领域(例如天气预报)来加以客制化,目的在于将辞汇的取代缩小于该特定领域的专有名词上,以借此改进翻译的结果。这样的技术适合针对一些使用较正规或是较制式化陈述方式的领域。例如政府机关公文或是法律相关文件,这类型的文句通常比一般的文句更加正式与制式化,其机器翻译的结果通常比日常对话等非正式场合所使用语言的翻译结果更加符合语法。目前的翻译机器,有时可以得到可以理解的翻译结果,但是想要得到较有意义的翻译结果,往往需要在输入语句时适当地编辑,以利计算机程序分析。但是,机器翻译的结果好坏,往往取决于译入及译出语之间的词汇、文法结构、语系甚至文化上的差异,例如英语与荷兰语同为印欧语系日耳曼语族,这两种语言间的机器翻译结果通常比汉语与英语间机器翻译的结果好。因此,要改善机器翻译的结果,人为的介入仍显相当重要。一般而言,大众使用机器翻译的目的只是为了获知原文句子或段落的要旨,而不是精确的翻译。总的来说,机器翻译的效果并没有达到可以取代人工翻译的程度,所以无法成为正式的翻译。不过现在已有越来越多的公司尝试以机器翻译的技术来提供其公司网站多语系支援的服务。例如微软公司试将其 MSDN 以机器翻译来自动翻译成多国语言,如上文所说,知识库作为专业领域,其文法较为制式化,翻译结果亦更加符合自然语言。机器翻译的概念最早可追溯到17世纪。1629年,哲学家笛卡儿(René Descartes)提出了世界语言的概念,即将不同语言相同含义的词汇以统一符号表示。笛卡儿、莱布尼兹(Gottfried Wilhelm Leibniz)、贝克(Cave Beck)、基尔施(Athanasius Kircher)以及贝希尔(Johann Joachim Becher)等人曾试图编写类似世界语言的辞典。直到近代,借由机械的辅助,机器翻译的可行性大为提升。20世纪初期便有多位科学家与发明家陆续提出机器翻译的理论与实作计划或想法。沃伦·韦弗被誉为机器翻译的鼻祖。他抛却了俄语文本的含义,转而视为一堆“密码”。在美国和欧洲,他的团队和继任者在工作时都遵循着一个常理:“任何语言都是由一堆词汇和一套语法规则组成。只要把两种词汇放到机器里,按照人类组合这两种词汇的方式,为之建立一套完整的规则,机器就能破译“密码”。”1954年美国乔治城大学在一项实验中,成功将约60句的俄文自动翻译成英文,被视为机器翻译可行的开端。自此开始的十年间,政府与企业相继投入相当的资金,用于机器翻译的研究上。然而,ALPAC(自动语言处理顾问委员会,Automatic Language Processing Advisory Committee)在1966年提出的一项报告中表明十年来的机器翻译研究进度缓慢,未达预期。该项报告使得之后的研究资金大为减缩,直到近1980年代,由于电脑运算科技的进步,以及演算成本相对降低,才使政府与企业对机器翻译再次提起兴趣,特别是在统计法机器翻译的领域上。从人为的翻译来看机器翻译,翻译的过程可被细分如下:在这看似简单的步骤之后其实是复杂的认知操作。要能解译来源文字的完整意义,一个译者必须能够分析与诠释整段文章的所有特征,必须能够深度的了解其文法、语义、语法、成语等等,相当于了解来源语言的文化背景。译者同时也必须兼备目标语言相同深度的知识。于是,这对机器翻译便是一项挑战,即:要如何设计一个程式使其能够如同真人一样的“了解(认知)”一段文字,并且能够“创造”一段好似真人实际写作出来的目标语言的文字。机器翻译可以使用一种基于语言规则的语法,文字将会依语言学的方式来进行翻译,即一个最合适的目标语言的字词将会被用来取代来源语言的字词。能够优先解决对自然语言的正确认知与辨识,被视为机器翻译是否能够成功的最主要关键。一般而言,用规则法(rule-based method)分析一段文字,通常会先建立目标语言中介的、象征性的表义字词。再根据这中介的表义字词来决定使用人工国际语言(interlingual)化的机器翻译,或是使用转化原则法的机器翻译(transfer-based machine translation)。这些方法都必须拥有具备足够形态学的、语句学的、以及语义学的资讯以及大量的字词规则所建构的辞汇。常见机器翻译的难处在于无法给于适当且足够庞大的资讯,来满足不同领域或是不同法则的机器翻译法。举例来说,对于一个需要统计学法则的翻译法,给予它大量的多语言素材是必要的,但对于文法式法则的翻译法便显得没有太大意义。规则法机器翻译的范例包含了转化法(transfer-based)、中间语法(interlingual)、以及辞典法(dictionary-based)机器翻译
。机器翻译可利用辞典的词汇作翻译。因为这种翻译是“字对字”的,所以通常各字之间在意思上都没有任何关联。这种机器翻译法最适用于具有冗长的词语列表(意即非完整的句子)。例如产品型录的翻译。所谓范例法,即基于实例的翻译方法。基本思路是电脑模拟大量翻译实例(翻译语料库),进行有效替换的翻译策略。因此该方法依赖于翻译语料库的质量、规模和覆盖面。如果有完全一样的例句,则直接采用范例的译文;如果有多个相似的例句,则自动模拟相似度最高的译文,只需翻译不同部分即可;如果没有相似的译文,则必须进行基于统计或规则的方法进行翻译。根据乔姆斯基的转换生成语法而言,这种方法永远也无法赶上人的语言的变化。因此,这种方法算是比较笨的方法,类似于字典,我们可以从中查到有用的字词,甚至短语,但写出什么东西,却是字典无法实现的。因此这种方法有一定的实用性,但局限性也显而易见。统计机器翻译:是目前非限定领域机器翻译中,性能较佳的一种方法。统计机器翻译的基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。从早期基于词的机器翻译已经过渡到基于短语的翻译,并正在融合句法信息,以进一步提高翻译的精确性。统计机器翻译的首要任务是为语言的产生构造某种合理的统计模型,并在此统计模型基础上,定义要估计的模型参数,并设计参数估计算法。早期的基于词的统计机器翻译采用的是噪声信道模型,采用最大似然准则进行无监督训练,而近年来常用的基于短语的统计机器翻译则采用区分性训练方法,一般来说需要参考语料进行有监督训练。贝氏模型(Bayesian Model)也是一种机器翻译方法。近年来在语言服务产业掀起波澜的神经机器翻译就是利用巨大的人工神经网络计算一连串字词的几率以产生文意精确的翻译。将在未来数年持续改变翻译及语言在地化产业。在投入大量翻译资料集(data sets)以训练人工智能和机器学习模组后,神经机器翻译的品质已大幅改善。更重要的是,当神经机器翻译与人工编修搭配,无论在技术还是文化层面,更能达到ㄧ流的译文品质。因此,神经翻译与人工编修搭配需求庞大。
相关
- Ibuprofen布洛芬(英语:Ibuprofen,商品名:芬必得、普罗芬),是一种非类固醇消炎药(NSAID),用来止痛,退烧和消炎。可用于治疗经痛、偏头痛,和类风湿性关节炎。大约60%的人在使用任意一种NSAID后症状
- 滑膜炎滑膜炎是滑膜(英语:Synovial membrane)发炎的医学术语。滑膜内衬于具有空腔的关节,称为滑液关节。滑膜炎常造成疼痛,尤其是在关节活动时。由于滑液的增生累积,关节通常会肿胀。滑
- 肾性骨病肾性骨病(Renal osteodystrophy)或慢性肾病矿物质与骨骼疾病(CKD-MBD)属于骨病理学,其特征为"骨矿化不足"(bone mineralization deficiency),这是伴随着慢性肾病的电解质及内
- 去氧羟四环素-5,10,11,12a-tetrahydroxy-6-methyl- 4a,5,5a,6-tetrahydro-4H-tetracene-1,3,12-trione多西环素(其国际非专利药品名称为“Doxycycline”)也称为“强力霉素”“伟霸霉素”
- 谷氨酰胺谷氨酰胺(Glutamine)亦被称作谷氨酰胺,为人体中含量最丰富的非必需氨基酸,且是唯一一种可直接通过脑血管障壁(BBB)的氨基酸。在人体中储存于骨骼肌或血液中。当受伤或患病时,谷氨酰
- 佛罗伦萨共和国佛罗伦萨共和国(意大利语:Repubblica Fiorentina)是中世纪意大利的一个城邦国家,位于今意大利托斯卡纳大区,以佛罗伦萨为中心。1115年,佛罗伦萨脱离托斯卡纳侯国领,获得自治权,成立
- 乔华盛顿乔治·华盛顿(英语:George Washington,1732年2月22日-1799年12月14日),美国国父,1775年至1783年美国独立战争时的殖民地军总司令,1789年成为美国第一任总统(其同时也成为全世界第一位
- 坤舆万国全图《坤舆万国全图》,中国第一幅完整的经纬世界地图,明代万历年间绘制,在地理学和制图学界具有重要位置。经多次翻印摹抄,影响深远。明神宗万历十二年(1584年),意大利来华传教士利玛窦
- 波士顿肾蕨波士顿肾蕨(学名:Nephrolepis exaltata),又称波士顿蕨,是肾蕨属下的一种多年生蕨类植物,原产于世界各地的湿热带地区,后来成为一种园艺植物。波士顿肾蕨的叶长50-250厘米,宽6–15厘
- 澳大利亚陆军澳大利亚陆军(Australian Army),为澳大利亚的陆上武装部队。与皇家澳大利亚海军、皇家澳大利亚空军构成澳大利亚的国防力量。澳大利亚陆军沿袭自英国陆军。大致可分成两个时期