影像翻译

✍ dations ◷ 2025-10-29 06:45:24 #影像翻译

影像翻译(英语:Image translation)是指将影像或照片中的文字翻译的技术,例如:海报、看板、餐厅菜单、告示牌、文件或屏幕截图等。光学字符识别(OCR)的技术可以抽取出影像的文字,然后这些文字会翻译成想要的语言,然后使用数字图像处理的技术,将原图处理成一张文字被翻译过的新图。影像翻译也和机器翻译的研究领域相关。

机器翻译的研究让文字的翻译变得更加简便,而光学字符识别技的进展让人们可以翻译影像中的文字。在2004年,日本的手机第一次引进光学识别的技术,让用户可以透过镜头将拍到的文字抽取出来。而且,抽取出的文字可以被进一步处理,被存储成网址的URL链接,或是拿来使用在电子邮件或短信。

近年来,移动设备的硬件有长足的进步,相机的画质提升而且自动对焦的技术也被开发,让使用手机进行文字的扫描变成可能。于是,影像翻译的技术出现了,让用户在扫描出影像中的文字之后,还能够进一步将文字翻译成他们想要的语言。越来越多的相关应用也开始出现,例如:Word Lens。在这个程序被Google获取之后,它成为了Google翻译行动app的一部分。

另外,随着影像处理技术的同步发展,人们可以将影像中的文字替换成翻译过后的文字,而处理成一张全新的照片。

影像翻译的展来源自于光学字符识别的进步,由于需要进行光学字符识别的存储器和运算量比以往减少许多,让移动设备也能够进行文字的扫描。

第一个声称可以用移动设备的相机镜头"阅读"文字的是International Wireless这家公司。他们在2003年发布了CheckPoint和WebPoint这两个软件。前者可以用来识别发票的文字,后者可以识别被印出来的网址链接,并在设备上开启该网站。 在2005年九月,NEC和日本的Nara科学研究机构发布一个新的软件,让用户可以用手机进行文字的扫描,而且这个软件可以扫描整页的文件。然而,这两家公司宣布他们不会在2008年底之前发布这份软件的商用版。

到了2008年四月,Nokia发布了Shoot-to-Translate应用程序,可以将设备拍摄到的影像中的文字抽取出来并翻译。这个应用程序只提供中文和英文之间的翻译,Nokia那时也表示他们正在开发名叫Multiscanner的产品,希望能够提供52种语言之间的翻译。 在2014年五月,Google获取了Word Lens的使用权,让视觉和语音的翻译质量有了显著的进步,让移动设备可以立刻地翻译扫描的的文件或是图片。在2018年八月,一家印度公司开发了ImageTranslate,它可以识别、翻译影像的文字,并且重新生成一张文字被翻译过后的图片。

现今,常见的影像翻译服务由以下几家公司所提供:

相关

  • 嗜碱性粒细胞嗜鹼性球或嗜鹼性粒細胞(英语:Basophil 或 Basophilic granulocyte)是一种最少见的粒细胞,约占循环系统中白细胞的0.5%至1%,得名自其可以被碱性的染料染上色的特性,是许多免疫反应
  • 查理士·凡而侬·波伊斯查尔斯·弗农·波伊斯爵士, FRS (英语:Sir Charles Vernon Boys,1855年3月15日-1944年3月30日),英国物理学家,以其精巧而新颖的实验留名后世。波伊斯发明了熔融石英纤维扭力弹簧,这
  • 交通规划交通规划是一门关于交通设施选址、配设等领域的学科。传统意义上的交通规划包括线路规划,站场选址与设计,以及交通流的调配等,一般的方法为:确定规划目标,明确主要问题,提出多种方
  • 捷克斯洛伐克共产党已消亡已放弃共产主义意识形态已消亡已放弃共产主义意识形态已消亡已放弃共产主义意识形态已消亡已消亡已放弃共产主义意识形态捷克斯洛伐克共产党(捷克语:Komunistická stra
  • 杉山佳寿子杉山佳寿子(日语:杉山 佳寿子,1947年4月9日-),日本资深女性配音员、舞台演员,大阪艺术大学教授(放送学科声优学系)。出身于爱知县名古屋市。身高153cm。AB型血。本名涩川佳寿子(日语:渋
  • 贾马尔普尔贾马尔普尔(Jamalpur),是印度比哈尔邦Munger县的一个城镇。总人口96659(2001年)。该地2001年总人口96659人,其中男性51262人,女性45397人;0—6岁人口13288人,其中男6750人,女6538人;识
  • 北方网北方网是一家互联网中文门户网站,成立于2000年11月,由天津人民广播电台、天津电视台、天津有线电视台、天津广播电视报社、天津市对外文化交流协会、天津日报社和今晚报社发起设立。2009年8月,中宣部、文化部、国家广电总局、新闻出版总署联合授予北方网“全国文化体制改革先进企业”称号。
  • 安东尼奥·里维拉安东尼奥·里维拉·乔达(西班牙语:Antonio Ribera i Jordà,加泰罗尼亚语:Antoni Ribera i Jordà,1920年1月15日-2001年9月24日)是西班牙作家、翻译家、幽浮学家和潜水员,著有数十本书籍。为加泰罗尼亚语作家协会(英语:Associació d'Escriptors en Llengua Catalana)和加泰罗尼亚笔会(加泰罗尼亚语:PEN català)成员。1953年,他将探险家雅克-伊夫·库斯托的著作《寂静的世界》译为西班牙文。此外他还撰有几本关于
  • 鲍里斯·多布罗杰耶夫鲍里斯·季霍诺维奇·多布罗杰耶夫(俄语:Борис Тихонович Добродеев,1927年4月28日-2022年9月23日),俄罗斯编剧。1927年出生于沃罗涅日。1949年毕业于莫斯科全联盟国立电影学院编剧系,曾任莫斯科电影制片厂剪辑师。1957年后开始从事编剧工作,主要担任了《第一个教师》《红色外交官列昂尼德·克拉辛生平》《卡尔·马克思的青年时代》等历史传记类纪录片的编剧。1975年加入苏联作家协会。2022年9月23日逝世。有两个儿子:
  • 说唱天神《说唱天神》(英语:"Rap God")是美国说唱歌手阿姆的歌曲。这首歌于2013年10月14日在YouTube首播,并于2013年10月15日在美国发行,为阿姆第八张录音室专辑《超级大痞子二部曲》的第三首单曲。内容论及阿姆职涯先前的争议,以及其他说唱歌手的行为。这首歌获得评论界的普遍好评,他们称赞阿姆的叙事能力和说唱速度,但亦有人指责其歌词恐同。这首歌凭借1560个单字拿下《吉尼斯世界纪录》史上词汇量最多的歌曲。歌曲于2015年获得格莱美奖最佳说唱表演(英语:Grammy Award for Best