翻译记忆

✍ dations ◷ 2024-11-06 00:39:26 #翻译记忆
翻译记忆(亦称翻译内存、翻译记忆库,translation memory,缩写为TM)是计算机程序软件的数据库,用来辅助人工翻译。有时,使用翻译记忆库的软件也常被称为 TMM (Translation Memory Managers)或者译者的工作台(translator's Workstation)。翻译记忆库多见于电脑辅助翻译工具、文字编辑程式、专用术语管理系统(Terminology Management Systems)、多语辞典、甚至是纯机器翻译的输出之中。一个翻译记忆单元包含了源语言的一个句段(segment)以及其所对应的翻译。这些句段可以是文字区块、章节、一个或是数个句子、或是词语。个别的字词常被视为专用术语来处理,一般而言不在翻译记忆的领域之中(即使翻译记忆库依旧可以包含单一字词为其翻译记忆单元)。研究显示:市场上已有很多公司,使用了翻译记忆库的技术,来辅助建立多语言文件。译者首先提供一段来源文字(亦即要拿来被翻译的文字)给翻译记忆库,程式会先分析这段文字,试着在数据库里找寻既有的翻译区段是否与过去曾经翻译过的文字相符。如果找到相符的旧有翻译(legacy translation pairs),则会呈现出来给译者检阅。译者可以选择接受旧有的翻译、拒绝、或是加以修改。若加以修改,则修改的版本也会被记录并存进数据库里。某些翻译记忆库系统只会搜寻 100% 相符的文字,也就是说:只会将新的来源文字与数据库内做精确的比对,只有完全相符的资料才会被提出。也有其他的系统会使用模糊比对原理来找寻相似的区段,并且会用特别的标记呈现给译者使其易于辨认。有一点很重要的是一般的翻译记忆系统只会从其数据库里搜寻来源语言。完全无相似(no match)的文字区段将必须由译者手动的翻译。这些新翻译的文字区段会被存进数据库里,则未来的翻译将有可能因为来源文字重复出现而可以马上被采用。翻译记忆库在文章字词重复相当高的情况之下将可运作的相当好,例如一些技术文件或是手册。翻译记忆库对于翻译一个从过去既有文件逐步增修的状况来说也很有帮助。一般而言,翻译记忆库在文学或是创意文件里不会被考虑采用,主要是因为这些类型的文章其重复性相当低。然而,也有人认为这些重复性极低的文字仍就值得加以搜集,例如在用语索引(concordance)的搜寻时便可派上用场。其他搜集翻译记忆库的帮助也可在品质验证和校阅时有所帮助(利用翻译记忆库,可以很简单的将来源语言与目标语言汇出,使其每行一对,并且以 tab 分隔来源与目标,便于确认有无未翻文字,或是使译者便于校阅)。当翻译记忆库被持续的使用在适当的文字上一段时间之后,其将可为译者省下不少的工作量。翻译记忆针对技术文件或是具有特定辞汇的文章来说是最合适的。其优势包含:使用翻译记忆所面临主要的困难与缺点包含如下:以下说明翻译记忆的主要功能这功能是用来将外部的文字与翻译从文字档传输到翻译记忆库里。汇入功能的来源档案可以是原生档案,也可以是其他业界标准的翻译记忆档案。有时有些翻译记忆库是以其他形式储存,则必须透过一些格式转换才能进行汇入。分析的过程可以再细分为下面几项:“文字记忆”(Text Memory)是基于LISA OSCAR xml:tm 标准而定义的。文件记忆包含了作者(译者)的记忆与翻译记忆。在创作(翻译)的过程中,每一个文字单元都会被赋予一个唯一的辨识码。文字单元是构成文句的一个子集。在翻译过程中,唯一个辨识码会被记忆下来,如此则目标语言的文件皆会被一一的对应到每一个文字单元的层级。如果来源文件随后被更改而异动,则文件里没有异动的文字单元将可直接的被转一到新的目标语言版本而不须译者而额外的检阅、翻译等互动。这是翻译记忆里的“精确”(exact)或是“完美”(perfect)相符的概念。“xml:tm”也提供了文件内对应汇入与模糊比对的机制。Translation Memory Exchange format(翻译记忆交换格式),TMX标准实现不同翻译软件供应商之间翻译记忆库的互换,为翻译社群所采纳的汇入汇出翻译记忆的最佳办法。目前最新的版本是1.4b,允许从TMX资料重建来源文件和目标文件。Termbase Exchange format(Termbase交换格式),该标准允许含有详细词汇资讯的术语资料作互换。TBX的数据结构架构由ISO 12620、ISO 12200、以及ISO Committee Draft 16642(别名TMF,Terminological Markup Framework)所提供。ISO 12620 提供完整定义的“资料类别”清单,其中包含可做为项目类型或预定值的标准化名称。ISO 12200 (亦称为MARTIF) 提供TBX核心结构的基础。Segmentation Rules Exchange format(分段规则交换格式)。SRX的目的是加强TMX标准,以便可以更有效率地使用在应用程序之间交换的翻译记忆资料。GILT Metrics. GILT stands for 全球化(Globalization)、国际化(Internationalization)、本地化(Localization)与翻译(Translation)。Open Lexicon Interchange Format.XML Localisation Interchange File Format(XML本地化交换档案格式)。其目的是提供所有当地语系化提供者都能了解的单一档案交换格式。XLIFF是业界使用XML格式来交换资料时的惯用方式。Translation Web Services(翻译线上服务).xml:tm一般译者通常使用桌上翻译记忆工具来完成翻译工作。桌上翻译记忆工具是适用于翻译用途的工具,就如同文书处理程式是适用于写作的工具。集中式翻译记忆系统将TM储存于中央服务器。

相关

  • 吕克·蒙塔尼耶吕克·蒙塔尼耶(法语:Luc Montagnier,1932年8月18日-) ,法国病毒学家,2008年诺贝尔生理学或医学奖获得者。 吕克·蒙塔尼耶是世界艾滋病研究及预防基金会(World Foundation for AID
  • 奥尔堡自治市奥尔堡自治市(丹麦语:Aalborg Kommune)是丹麦的一个自治市,位于日德兰半岛北部,属北日德兰大区。面积1,133.99平方公里,2009年人口196,292人。首府奥尔堡。2007年由原奥尔堡自治市
  • 洛克菲勒大学洛克菲勒大学(英语:Rockefeller University)是一所私立大学,主要专注于生物医学领域的研究,位于纽约曼哈顿。前身为洛克菲勒医学研究所(Rockefeller Institute for Medical Resear
  • 蒙特赛拉特·卡芭叶玛丽亚·德蒙特塞拉特·维维安娜·康塞普西翁·卡芭叶-富尔克(加泰罗尼亚语:María de Montserrat Viviana Concepción Caballé i Folc,1933年4月12日-2018年10月6日),常简称蒙
  • 轮是以圆形的物体造成大为减少磨擦。如果配上轴,即成为车的最主要构成部分。轮在交通运输中非常有用,是人类的重要发明之一。除了车轮以外,其他圆形的轮还有舵轮(英语:Ship's whe
  • 第一性征生物性别(英语:sex)又称生殖性别或生理性别、生物中有许多物种可以划分成雄性及雌性,不过也有些会是间性。有性生殖是指雄性和雌性生物将其基因特质混合重组,繁衍后代的过程。配
  • 3rd黄体制剂(英语:Progestin)是一种合成的孕激素,与孕酮有类似效果。Progestin的两种最重要用途为激素避孕(英语:Hormonal contraception)(独立或与雌激素一同使用)以及作为激素替代疗法
  • 丝裂霉素C丝裂霉素(Mitomycin),属抗生素类的抗肿瘤药,用以治疗癌症,如:胃及胰脏的腺癌、膀胱癌。作用在于减缓或停止体内癌细胞的生长。卤化/核糖核苷酸还原酶抑制剂(克拉屈滨、克罗拉滨、氟
  • 喂母奶母乳哺育(Breastfeeding),亦称哺乳、授乳或母乳喂养,指的是女性以乳房喂食婴儿母乳的行为。婴儿有吮吸反射,因此可以吮吸乳房并吞咽母乳,专家建议在出生后一小时即可哺喂母乳,之后
  • 苏莱曼所罗门(希伯来语:שְׁלֹמֹה‬‎),天主教汉译为撒罗满,阿拉伯语称为苏莱曼(سليمان)。根据《希伯来圣经》记载,是以色列王国第三位国王,大卫家族第二位国王,是北方以色列王