Google神经机器翻译系统

✍ dations ◷ 2024-09-20 14:57:24 #人工智能应用,计算语言学,机器翻译,神经网络

Google神经机器翻译系统(英语:Google Neural Machine Translation,简写:GNMT),是Google开发的神经机器翻译(英语:Neural machine translation)(NMT)系统,于2016年11月推出,它使用人工神经网络来提高Google翻译的流畅度和准确性。Google神经机器翻译系统通过应用基于实例的(英语:Example-based machine translation)(EBMT)机器翻译方法来改进翻译质量,系统会从数百万个示例中学习。翻译系统提出的系统学习架构首先通过Google翻译支持的一百多种语言进行了测试。随着大型端到端(英语:End-to-end principle)框架的发展,系统会随着时间的推移学习,做出更好,更自然的翻译。GNMT能够一次过翻译整句句子,而不是逐字翻译。

谷歌大脑项目于2011年由Google研究员杰夫·迪恩,格雷戈·科拉多和史丹佛大学计算机科学教授吴恩达在Google X秘密实验室成立。吴恩达的工作令Google和史丹佛大学获取了突破。

2016年9月,Google研究团队宣布开发Google神经机器翻译系统,同年11月,Google翻译停止使用其自2007年10月以来一直使用的专有统计机器翻译(SMT)技术,开始使用神经机器翻译(英语:Neural machine translation)(NMT)。

Google翻译的NMT系统使用了一种能够深度学习的大型人造神经网络。GNMT使用通过使用数百万更广泛的来源来推断出最相关的翻译,提高翻译的质量。然后将结果重新排列并组成基于人类语言的语法翻译。GNMT提出的系统学习架构通过Google翻译支持的语言进行了测试。GNMT没有创建自己的普遍语言,而是针对许多语言之间发现的共同点,因此心理学家和语言学家比计算机科学家对此更感兴趣。2016年,Google翻译的其中八种语言开始尝试使用此系统,包括英语,法语,德语,西班牙语,葡萄牙语,中文,日语,韩语和土耳其语。2017年3月,增加了俄语、印地语和越南语。同月,因谷歌翻译社群的帮助下,添加了对希伯来语和阿拉伯语的支持。2017年4月底,增加了9种印度语言的支持,包括印度语,孟加拉语,马拉地语,古吉拉特语,旁遮普语,泰米尔语,泰卢固语,马拉雅拉姆语和康纳达语。

GNMT系统改进了以前的Google翻译系统,GNMT系统可以处理“零点翻译”,即直接将一种语言翻译成另一种语言(例如中文到日文)。以前Google翻译会先将源语言(英语:Source language)翻译成英文,然后将英文翻译成目标语言(英语:target language),而不是直接从一种语言翻译成另一种语言。

相关

  • 蠹鱼衣鱼(学名:Lepisma saccharina),俗称蠹、蠹鱼、白鱼、壁鱼、赤木虫、书虫或衣虫,古名蛃(音同“丙”)或蟫(音同“覃”),是一种灵巧、怕光、怕空气扰动、而且无翅的昆虫,身体呈银灰色
  • 简并态物质简并态物质在物理是一种自由的集团、非互动的颗粒,由量子力学的效应决定它的压力和其它物理特征。它类比于古典力学中的理想气体,但简并态物质是离经叛道的理想气体,它有极高的
  • 慢性创伤性脑病变慢性创伤性脑病变(英语:Chronic traumatic encephalopathy;简称:CTE)是一种神经退化性疾病,常发生于受到多次脑伤的患者。慢性创伤性脑病变常发生于,频繁参与剧烈接触型运动(例如美
  • 因斯布鲁克因斯布鲁克(德语:Innsbruck)位于奥地利西部群山之间的因河畔,是蒂罗尔州的首府。穿越阿尔卑斯山通往意大利南蒂罗尔地区的布伦纳山口从这里开始。因斯布鲁克的名字来自于因河和
  • 嚈哒嚈哒(Hephthalites)又作挹怛、挹阗,是晚古典时代西域的一支游牧民族,曾于中亚、南亚地区建立规模广大的嚈哒帝国。嚈哒人被东罗马帝国史学家称为“白匈”,其亦曾自号匈人。嚈哒人
  • 廖焕文墓廖焕文墓是一座位于台中市南屯区的墓葬建物,兴建并完工于昭和9年 (1934年)。廖焕文在日治初期弃武从农,并因经营蔗田事业成功奠定家业;廖氏曾任南屯山子脚保正,并曾捐出物资提倡
  • 李德仁 (科学家)中国科学院院士 (地学部,1991年)中国工程院院士 (信息与电子工程学部,1994年)李德仁(1939年12月31日-),中国摄影测量与遥感学家。出生于江苏泰县。籍贯江苏镇江丹徒。1963年毕业于武汉
  • 上夸克1.5–3.3 MeV/c2在所有种类的夸克中,上夸克(Up quark)的质量最小,裸质量约为1.8–7000300000000000000♠3.0 MeV/2。上夸克是第一代夸克, 是自旋为1⁄2的费米子。带有电荷+2⁄3
  • 长隔木属长隔木属(学名:)是茜草科下的一个属,为灌木植物。该属共有40种,分布于中、南美洲。
  • DirectX GraphicsDirectDraw,微软Direct X的一员,是基于COM架构下的2D API,例如DirectDraw的Blt()用于表面间整体图像或是部分图像的移动。DirectDraw渐被Direct3D所取代,DirectShow的VMR-7 是以