Google 翻译

✍ dations ◷ 2025-02-23 10:11:13 #Google,机器翻译,Android软件,2006年面世的产品

Google翻译(英语:Google Translate)是一项由Google提供的翻译文段及网页的服务。

与其他网站巴别鱼、美国在线及雅虎使用SYSTRAN引擎不同的是,Google使用自己开发的翻译软件,大部分语言采用统计机器翻译技术,少部分语言采用Google神经机器翻译系统。

至2015年6月,Google翻译称每天需要处理超过1000亿笔字词。。

Google翻译提供即时翻译功能(即时输入即时翻译),用户可以在左边的输入字段输入文字,翻译结果会即时在右边的结果框显示。将鼠标移到翻译结果文字上可以看到其对应的原文。此外,Google翻译亦提供朗读功能(包括原文和译文),用户亦可查看日文的罗马字、汉字的汉语拼音,甚至韩文罗马字表记法等等。

与其他自动翻译工具类似,Google翻译亦有其自身功能局限。虽然用户可以通过其帮助来大致理解以外文书写的文章大意,但Google翻译服务无法提供准确的译文,也不能提供可用于出版的内容,例如,它经常会不依据上下文来翻译词汇,而且会在翻译时不遵守语法规则,这是因为其机器翻译算法与传统的基于语法分析的算法不同,采用的是基于统计分析的算法。而Google翻译的质量也与语种有关,当源语言是一种欧盟语言,而目标语言是英语时,往往质量较好。2010年的分析显示,法语到英语的翻译相对准确,2011年和2012年的分析显示意大利语到英语的翻译同样相对准确。然而,当所翻译的文本较短时,其他规则法机器翻译(rule-based machine translation)却表现得更好,这在中文到英语的翻译中尤为明显。

使用较广泛的语言都有“朗读”功能,对多中心语言而言,朗读采用的口音取决于所在地区,例如:

Google翻译采用的翻译方法称作“统计机器翻译”,具体而言,采用的是基于Franz-Josef Och参加2003年美国国防部高级研究项目局(DARPA)的机器速度翻译竞赛时获奖的研究成果。Och现在领衔Google机器翻译小组。

根据Och的说法,若想要开发一个可用于翻译一对全新语言对的统计机器翻译系统,必须做好如下的数据基础搜集才能有保障:一个拥有百万的单字数量级别的双语文本语料库(或者其平行库集合),以及属于这两种语言的单语语料库,各自得拥有十亿以上的单字。然后,用于翻译这一对语言的机器翻译结果就会通过这些数据产生的统计模型而得出。

为了获取这种海量容量的语言学数据,Google采用了联合国文档作为语料库内容来源。由于同样的一份联合国文档通常会有属于六种联合国官方语言的译本,因此,Google如今就拥有了一个相当于经人工翻译了两百万单字的七种语言的语料库。

而这一点很可能就是Google翻译之所以一开始专注的是开发英语和阿拉伯语、中文之间的翻译系统,而非英语和日语或英语和德语这两对语言之间的翻译系统的原因。因为阿拉伯语和中文属于联合国六种官方语言,而日语、德语不是。

Google的专员卓坤婷曾积极参加在日本举行的国内会议,在会场上向专家征集英日两种语言之间的双语语料库。

目前Google支持翻译103种语言。

这些语言还没有被Google翻译支持,但在翻译社群中有提供。

划取翻译功能是现代浏览器的重要基础功能,翻译的集成意味着打破文化壁垒,Opera和Firefox的翻译插件亦是利用谷歌翻译API作为扩展程序的核心外部接口。不过当下许多浏览器厂商,在浏览器大战背景下,出于激烈竞争,已经做出了一站式服务,例如Windows10中自带的MicrosoftEdge,微软专门为此定制了浏览器插件版的微软必应翻译。

开发者可以利用谷歌提供的API,对软件集成联网翻译功能。这些软件通常是通过集成翻译功能,实现对原有用途的用户需求满足,所完善而来。例如阅读软件、在线资料搜索时集成的WebJS小程序,由于信息技术的普遍应用和入口之争以及成熟度,目前已不再有着垄断地位,也就不存在增加翻译功能需要收费或是插广告,除非是态度问题,否则一般会作为硬性标准。

当今智能手机和平板电脑平台上,亦有很多基于Google翻译而派生成的翻译软件。不但在今日动则几十M的软件膨大趋势下做到了体积小巧,而且可以下载离线字典调用,甚至可以翻译屏幕上光标停按的部分。

2014年5月31日起,Google所有服务(各个IP段)在中国被大规模干扰至今,但因为翻译及地图网页版服务有域名后缀为.cn的入口,并且使用了专门设立在中国境内的服务器和IP地址,所以翻译及地图网页版仍然能正常服务。

2017年3月29日起,中国大陆用户可以直接使用Google翻译(手机版)而不需要使用代理。在此之前,翻译需使用代理而无法直接翻译,但下载离线翻译包后可使用离线翻译进行翻译。

Google翻译曾经内置有一个小彩蛋,在输入特定文字后让程序朗读,可以输出Beatbox的效果。目前该彩蛋已经移除。

相关

  • 丙糖丙糖(Triose),又称为三碳糖,是含有三个碳原子的一类单糖,共包含两个化合物:丙糖是细胞呼吸过程中的重要物质。D-甘油醛:二羟基丙酮:果聚糖:菊粉 · 果聚糖β2→6甘露聚糖:低聚木糖:半
  • 铅酸电池铅酸蓄电池,又称铅蓄电池,是蓄电池的一种,电极主要由铅制成,电解液是硫酸溶液的一种蓄电池。一般分为开口型电池及阀控型电池两种。前者需要定期注酸维护,后者为免维护型蓄电池。
  • epinephrine肾上腺素(Epinephrine或Adrenaline), 3,4-三羟基-N-甲基苯乙胺。是肾上腺髓质分泌的激素及神经传导物质,也是一种药物。肾上腺素被应用于治疗多项疾病,包含全身性过敏反应、心搏
  • dz浊齿龈塞擦音(voiced alveolar affricate)是塞音d和擦音z紧密结合形成的一个浊塞擦音,国际音标为⟨d͡z⟩或⟨d͜z⟩。意大利语的浊z是此音。浊齿龈塞擦音的特征包括:当符号成对
  • 激光武器激光武器就是用高能的激光对远距离的目标进行精确射击或用于防御导弹等的能量武器,美国也称为战术高能激光武器(THEL)。它的突出优点是反应时间短,可拦击突然发现的低空目标。用
  • ATC代码 (A05)A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码A05(肝、胆疾病治疗药)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Co
  • 可怕多毛苍蝇可怕多毛苍蝇(学名:)是肯雅一种很罕有的苍蝇。它们最初是在肯雅Okazzi山脉中的一个位点发现,其幼虫则是在蝙蝠的粪石中发现。估计成虫是以蝙蝠身体的分泌物为食物。可怕多毛苍蝇
  • 埃克曼数埃克曼数(Ekman number,简称Ek)是用来描述海洋及大气的地球物理学现象的无量纲数。埃克曼数是流体的黏滞力和行星自转产生的科里奥利力的比值,埃克曼数得名自瑞典海洋学家沃恩·
  • 锥齿狐蝠属锥齿狐蝠属(锥齿狐蝠),哺乳纲、翼手目、狐蝠科的一属,而与锥齿狐蝠属(锥齿狐蝠)同科的动物尚有狐蝠属(游狐蝠)、果蝠属(棕果蝠)、沟齿果蝠属(沟齿果蝠)、安氏果蝠属(安氏果蝠)等之数种哺乳
  • 程东红程东红(1953年11月-),重庆人,汉族,中华人民共和国政治人物、第十二届全国人民代表大会重庆地区代表。2005年毕业于北京师范大学比较教育学专业。1978年加入中国共产党。2013年,担任