Google神经机器翻译系统

✍ dations ◷ 2025-04-26 16:44:29 #人工智能应用,计算语言学,机器翻译,神经网络

Google神经机器翻译系统(英语:Google Neural Machine Translation,简写:GNMT),是Google开发的神经机器翻译(英语:Neural machine translation)(NMT)系统,于2016年11月推出,它使用人工神经网络来提高Google翻译的流畅度和准确性。Google神经机器翻译系统通过应用基于实例的(英语:Example-based machine translation)(EBMT)机器翻译方法来改进翻译质量,系统会从数百万个示例中学习。翻译系统提出的系统学习架构首先通过Google翻译支持的一百多种语言进行了测试。随着大型端到端(英语:End-to-end principle)框架的发展,系统会随着时间的推移学习,做出更好,更自然的翻译。GNMT能够一次过翻译整句句子,而不是逐字翻译。

谷歌大脑项目于2011年由Google研究员杰夫·迪恩,格雷戈·科拉多和史丹佛大学计算机科学教授吴恩达在Google X秘密实验室成立。吴恩达的工作令Google和史丹佛大学获取了突破。

2016年9月,Google研究团队宣布开发Google神经机器翻译系统,同年11月,Google翻译停止使用其自2007年10月以来一直使用的专有统计机器翻译(SMT)技术,开始使用神经机器翻译(英语:Neural machine translation)(NMT)。

Google翻译的NMT系统使用了一种能够深度学习的大型人造神经网络。GNMT使用通过使用数百万更广泛的来源来推断出最相关的翻译,提高翻译的质量。然后将结果重新排列并组成基于人类语言的语法翻译。GNMT提出的系统学习架构通过Google翻译支持的语言进行了测试。GNMT没有创建自己的普遍语言,而是针对许多语言之间发现的共同点,因此心理学家和语言学家比计算机科学家对此更感兴趣。2016年,Google翻译的其中八种语言开始尝试使用此系统,包括英语,法语,德语,西班牙语,葡萄牙语,中文,日语,韩语和土耳其语。2017年3月,增加了俄语、印地语和越南语。同月,因谷歌翻译社群的帮助下,添加了对希伯来语和阿拉伯语的支持。2017年4月底,增加了9种印度语言的支持,包括印度语,孟加拉语,马拉地语,古吉拉特语,旁遮普语,泰米尔语,泰卢固语,马拉雅拉姆语和康纳达语。

GNMT系统改进了以前的Google翻译系统,GNMT系统可以处理“零点翻译”,即直接将一种语言翻译成另一种语言(例如中文到日文)。以前Google翻译会先将源语言(英语:Source language)翻译成英文,然后将英文翻译成目标语言(英语:target language),而不是直接从一种语言翻译成另一种语言。

相关

  • 泛音泛音是指分音列中除了基音以外的任何一音。当一根弦或空气柱整体振动而产生基音(第一分音)时,在该基音上发出的微弱的音。如果分成几段振动就会产生一些泛音(上方分音)。听者一般
  • 中性进化理论中性演化理论全称为分子演化的中性理论(英语:Neutral theory of molecular evolution),简称为中性理论。是日本遗传学家木村资生在1968年早期所提出的一种演化理论。这个理论认
  • 内布拉星象盘内布拉星象盘(德语:Himmelsscheibe von Nebra,英语:Nebra Sky Disk)是一个直径 30 公分的青铜盘,上面布满了蓝绿色的绿锈和嵌上了黄金制的符号。盘上符号其中一个可能是太阳或满月
  • 止鼾器止鼾器是一种通过调整下颚位置,来达到使阻塞的呼吸道得以畅通的医疗器械。可减轻睡眠时呼吸不顺而造成打鼾或呼吸中止而影响睡眠的情形。
  • 中世纪中期中世纪中期(又称中世纪盛期,英语:High Middle Ages)是指欧洲历史的一段时期,是中世纪发展最高峰期,一般认为包括11世纪、12世纪和13世纪,承接中世纪前期和后期。约1000年左右,西欧国
  • PlanetMathPlanetMath是一本自由、协作的网络数学百科全书。强调同行评审、严密、公开、具教育性、实时内容、内容互连、以及群体协作。PlanetMath的目标是成为一本综合性的网络数学百
  • 真菌分类系统真菌分类系统是关于真菌的科学分类法。19世纪至今,各学者对真菌的分类不尽相同,其中最常用的是安斯沃斯在1971年作出的分类系统。1935年,恩斯特·贝西(Ernst Bessey)出版了美国第
  • 岸田今日子岸田今日子(日语:岸田 今日子,1930年4月29日-2006年12月17日),日本女演员、配音员、童话作家。身高156cm。A型血。1930年4月29日出生于东京府豊多摩郡(今东京都杉并区),父亲是剧作家
  • 战备跑道战备跑道,是指为避免发生战争时,跑道遭毁或被占据,在公路中,设计可供军用飞机降落的路段。其路面需笔直无弯道,装有灯光标志,没有电杆、路灯、高层建筑、跨线桥、天桥之类的障碍物
  • 德布尔算法数学的子领域数值分析中,De Boor算法是快速而且数值上稳定的算法,用于计算B样条形式的样条曲线。这是用于贝兹曲线的de Casteljau算法的一个推广。一般的情况如下。我们要构造