OmegaT

✍ dations ◷ 2025-09-08 22:34:12 #OmegaT

OmegaT是一个使用Java编程语言编写的计算机辅助翻译工具。它是自由软件,最初的开发由Keith Godfrey在2000年进行,目前的开发工作由Didier Briel带领的团队进行。OmegaT名称在德国是注册商标。

OmegaT适用于专业译员。它的功能包括使用正则表达式的可自定义分段,带有模糊匹配和匹配传播的翻译记忆,术语库匹配,词典匹配和参考资料搜索以及使用Hunspell拼写词典的内联拼写检查功能。

OmegaT可运行于Linux、Mac OS X和Microsoft Windows 98 SE或更高版本,并且需要Java 1.5。它的界面和文档被翻译成29种语言。在2010年对458名专业译员的调查表明,OmegaT的用户数达到Wordfast、DejaVu和MemoQ的1/3,且达到了市场领导者塔多思的1/8。在Bing翻译的合作伙伴中,OmegaT是其中唯一一个免费的专业级辅助翻译工具。

OmegaT最初由Keith Godfrey开发于2000年。当时使用C++进行编写。

在2001年二月首次公开发布的版本使用Java写成。在这个版本中使用专有翻译记忆库格式。它能翻译无格式的纯文本文件、HTML以及执行块级别的分割规则(即分割成段落而不是句子)。

OmegaT的开发托管在SourceForge。开发团队由Didier Briel领导。和许多开源项目一样,新版本的OmegaT会频繁发布,通常每个新版本含有2-3个错误修改和功能升级。这个指的是“标准”版本,其中总是含有完整的用户手册和包含一些还未写入用户手册的功能的“最新”版本。可以从Sourceforge的代码版本库的更新源进行更新。

对于每个翻译任务,OmegaT会创建包含指定文件的项目文件夹的集合。用户把未翻译文档复制到其中的/source/子文件夹,而在翻译结束后,已翻译的文档会出现在/target/子文件夹中。OmegaT会在编辑窗格的片段中显示已分段的源文档的可翻译内容供用户翻译。

在开始翻译前,用户还可以复制以前的翻译记忆到/tm/子文件夹,复制术语库到/glossary/文件夹以及复制StarDict词典到/dictionary/文件夹,在翻译时OmegaT会自动查阅它们。

进行翻译时,OmegaT会自动检查以前的翻译以寻找类似的句子,找到后会显示在模糊匹配窗格中。译员可以使用快捷键把模糊匹配插入到编辑窗格。OmegaT还会查阅用户预先添加到项目文件夹的术语库和词典。如果启用了机器翻译,例如谷歌翻译,那么它会显示在单独的机器翻译窗格。

翻译结束后,OmegaT会创建已翻译的文件,并导出项目当前的翻译到TMX文件中,这样这些文件可以在以后翻译时重用或者和其他使用OmegaT或其他CAT工具的译员进行交换。

OmegaT拥有主流CAT工具具有的许多功能。包括创建,导入和导出翻译记忆,使用翻译记忆进行模糊匹配,查询术语表、索引定位和一致性搜索。

OmegaT还拥有其他CAT工具不具有的功能,包括:

OmegaT支持直接翻译多种文件类型。OmegaT根据文件扩展名来确定文件类型。可以自定义文件扩展名关联的处理方式和首选的编码来覆盖默认设置。

OmegaT把格式转换成标签来处理含格式的文档,类似于其他商业的CAT工具。

OmegaT可以直接翻译下列格式:

值得注意的是,OmegaT 还提供 MediaWiki 导入功能。

有两种方式让OmegaT处理不支持的格式:

Okapi Framework中的Rainbow程序可以把某些文件格式转换成OmegaT支持的XLIFF格式。Rainbow还可以从这类文档中创建完整的OmegaT项目文件夹,便于OmegaT的处理。

一些文件格式可以转换为能在OmegaT中翻译的Gettext Portable Object (PO) 文件。Debian Linux 中的po4a程序可以把类似LaTeX、TeX以及POD的格式转换为Gettext PO。Translate Toolkit可以把Mozilla .properties 和dtd文件、CSV 文件、某些Qt .ts文件以及某些XLIFF文件转换为Gettext PO。


从版本97到2003的Microsoft Word、Excel以及PowerPoint文档可以转换为Office Open XML (Microsoft Office 2007/2010)或ODF (OpenOffice.org)格式。这种转换过程并不是无损的,可能导致某些格式的丢失。

Trados® .ttx可以使用Okapi TTX Filter(页面存档备份,存于互联网档案馆)进行处理。

OmegaT的内部翻译记忆格式对用户不可见,但每次它自动保存翻译项目时,会自动把所有新增和更新的翻译单元都导出并添加到三个外部的TMX翻译记忆:一个本地的OmegaT TMX、一个级别1的TMX以及一个级别2的TMX。

导出的级别2文件包含了封装在TMX标签中的OmegaT内部标签,这样的TMX文件可以在支持TMX级别2的CAT工具中生成匹配。在Trados和SDLX中测试通过。

OmegaT支持导入最高1.4b版本级别1和级别2的TMX文件。在OmegaT中导入级别2的文件会生成相同级别的匹配,因为OmegaT会把外部的TMX标签转换为TMX级别2的标签。对于由Transit创建的TMX文件测试又通过了。

对于术语库,OmegaT主要使用tab分隔的UTF-8编码且扩展名为.txt的纯文本文件。术语库文件的结构非常简单:首列包含源语言词语,第二列包含对应的目标语言词语,第三列(可省略)与词语相关的上下文注释等。文本编辑器中可以很容易创建这样的术语库。

还支持使用标准CSV格式的类似结构的文件,对于TBX文件同样如此。

The OmegaT Project is a sort of “computer literacy” group that focus on translators' needs. Users are encouraged to contribute tools written by themselves in response to translators' needs which are not yet addressed by the main OmegaT program itself.

OmegaT的用户界面和文档已经被翻译为大约30种语言。志愿翻译人员可以翻译用户界面,“快速入门指南”简短向导或完整的用户手册(或者所有的三个部分)。所有的语言文件和用户手册的翻译都包含在标准的OmegaT发布程序中。

OmegaT用户社区的特色是对于OmegaT的不足之处经常提示用户创建实现那些功能的宏、脚本和程序,尽管有时某些功能后来会成为OmegaT自身的一部分。当OmegaT只能进行段落分割时,有用户创建了OpenOffice.org宏进行根据句子进行分割。当在OmegaT中自动平衡多个TM仍需合并TM时,有用户创建了TMX合并脚本。当OmegaT没有提供拼写检查支持时,有多个用户创建脚本或找到解决方案作为OmegaT的一部分用来在翻译过程中提供拼写检查功能。

当前提供了某些功能且尚未内置于OmegaT的工具包括一个用于Trados TagEditor文件的转换程序,两个简单的对齐器,一个不工作的术语添加工具以及一个把标签视为占位符的工具。

Autshumato包包含CAT工具,双语对齐器,PDF提取器,TMX编辑器和基于抓取数据的公共TM。最终的版本将包含术语管理器和机器翻译程序。其中的CAT工具是以OmegaT为基础构建的,且需要OpenOffice.org才能运行。它的开发资金由南非政府的艺术和文化部门提供。

Benten是基于XLIFF的Eclipse。它使用OmegaT代码来处理翻译记忆匹配过程。它的部分开发资金由日本政府提供。

Boltran是模仿OmegaT项目工作流程的基于网络的独立CAT工具。它基于开源的OmegaT构建,因此能翻译任何OmegaT可以翻译的内容,且含有与OmegaT几乎等同的术语管理和模糊匹配能力。目前,唯一公开的Boltran服务器是开发者的网站,但在理论上任何人都可以创建公开或私有的Boltran服务器。

OmegaT+ 是在 2005 年从 OmegaT 的 1.4.5 版本派生而来的 CAT 工具。其工作方式类似于 OmegaT,同时开发了一些自己的功能,且使用了与 OmegaT 不兼容的项目格式。在许多时候,这个名称容易让不了解的人误以为是 OmegaT 的增强版本,而实际上 OmegaT+ 只是 OmegaT 1.4.5 的增强版本,且从 2005 年至今 OmegaT 中已增加了大量功能增强和新特性。

相关

  • 弛缓 (核磁共振)弛缓或译作弛豫,在核磁共振(NMR)现象学上,针对磁化强度的演化分成两个面向:另外因为主磁场的局部不均匀,导致体积元素(voxel)内失相(dephase),使得x-y平面上实际的讯号衰减速度远
  • 大西洋 (杂志)(2018)2151-9463(网站)《大西洋》(英语:)是美国的一本杂志及多平台出版物,创刊于1857年的马萨诸塞波士顿,当时名为《大西洋月刊》(英语:The Atlantic Monthly),是一本文学和文化评论杂
  • 陈志列陈志列(1963年6月-),江苏无锡人,中华人民共和国企业家,研祥高科技控股集团董事局主席,第十一届、第十二届、第十三届全国政协委员。2018年,被评为改革开放40年百名杰出民营企业家。
  • 朴勇进朴勇进(朝鲜语: 박용진; 英语:Pak Yong-Jin,1989年1月29日-)朝鲜足球运动员。入选过朝鲜国家奥运足球队和朝鲜国家足球队。现在效力于朝鲜足球联赛球会鲤明水体育团。他曾经代表
  • 李森李森可以指:
  • 小森隼小森 隼(日语:小森 隼/こもり はやと  */?;1995年6月13日-)是日本男舞者,为歌舞组合GENERATIONS from EXILE TRIBE的表演者。三重县出身,为韩日混血儿(父为韩国人,母为日本人)。所属
  • 文斯·吉利根小乔治·文森·“文斯”·吉利根(本名:George Vincent "Vince" Gilligan, Jr.,1967年2月10日-)是一位美国的编剧、导演和制作人,以电视剧集作品出名。他是AMC剧集《绝命毒师》以及
  • 罗汝才罗汝才(?-1642年),陕西延安人,明末流寇。以狡猾多诈著称,外号“曹操”,后被李自成设计杀死。崇祯初年,罗汝才附和老闯王高迎祥;后联合张献忠,最后联合新闯王李闯(李自成),专事李自成。每破
  • 黑指纹海兔黑指纹海兔(学名:)为海兔科海兔属的动物。本物种的种小名(或种加词)由-(手指)和(黑色)两个字组成。如同其他同科物种,本物种有世界分布,见于几乎所有热带及温带海域:除见于印度洋、大西洋、以及太平洋,本物种于2002年首度于地中海发现,而且很快将整个地中海东部“殖民”:估计这很可能是全球变暖引致的结果,使它们得以在水温较冷的地中海栖息。在中国大陆,本物种分布于广西涠洲、海南三亚、西沙武德岛、广东汕尾等地,一般生活于海藻间。基于遗传学实证,现时本物种在印度洋-太平洋海域的分布被视为另一个物种。现时这个学名只
  • 东区门户计划区柯文哲系列 柯P新政 柯P新政建设 柯文哲现象 争议 组织 歌曲 其它相关 林钦荣系列 林钦荣政策东区门户计划区是位于台湾台北市南港区内的大规模都市更新区域,总面积440公顷,自2015年开始进行开发。定位为以南港车站四铁共构站区为中心,结合上述公共建设打造台北市新创产业经济轴带,并积极推动公办都市更新,提供优质公共住宅社区,改善地区整体生活环境,吸引青年定居,并以大众运输导向的都市发展模式,运用立体步行系统连接车站与相关建设基地,改善整体环境与达成人本交通目标,建立2050年台北市新东区愿景