国际统一码部件

✍ dations ◷ 2025-10-30 03:42:59 #国际统一码部件

国际统一码部件(英语:International Components for Unicode,缩写:ICU,中文译名根据联盟官方译名)是成熟的C / C++和Java库的开源项目的库,用于支持统一码 、软件国际化和软件全球化。 ICU 可广泛移植到许多操作系统和环境中。对于不同平台上,以及在 C、C++ 和 Java 软件的应用程序,它可以提供相同的结果。IBM和许多其他公司赞助、支持和使用它。 ICU 项目也已成为统一码联盟技术委员。

ICU 提供以下服务: 统一码文本处理、完整字符属性和字符集转换; 统一码正则表达式;完整的统一码集;字符、单词和行边界;基于语言的测序和搜索;规范化、大小写转换和脚本音译;通过通用当地数据存储库(CLDR)提供全面的语言环境数据和资源包架构;多种日历和时区;以及基于规则的日期、时间、数字、货币和消息的格式化和解析。 ICU过去曾为阿拉伯语、希伯来语、印度语和泰语提供复杂文字编排服务,但在第 54 版中已弃用,并在第 58 版中完全删除,取而代之的是HarfBuzz 。

ICU 提供比 C 和 C++ 标准库更广泛的国际化设施。 ICU 67 支持Unicode 13.0并处理英国脱欧的问题。 ICU 64 支持Unicode 12.0 ,而 ICU 64.2 增加了对 Unicode 12.1 的支持,即当前日本令和时代的单一新符号(但对它的支持也已向后移植到 ICU 4.8.2 的旧 ICU 版本)。 ICU 58(支持 Unicode 9.0)是支持旧平台(如Windows XP 、 Windows Vista )的最后一个版本。对AIX 、 Solaris和z/OS的支持在更高版本中也可能受到限制(即构建取决于编译器支持)。 自Windows 10版本 1703 起,ICU 已作为标准组件包含在Microsoft Windows中。

ICU 过去一直使用UTF-16 ,但只有用于 Java;而 C/C++ 使用 UTF-8 ,包括正确处理“非法 UTF-8”。

1996 年初,Taligent 并入 IBM 后,Sun微系统决定新的 Java 语言应该更好地支持国际化。由于 Taligent 拥有使用此类技术的经验并且地理位置接近,因此他们的 Text 和 International 小组被要求将国际类作为JDK 1.1 国际化API 贡献JDK。 该代码的很大一部分仍然存在于java.text和java.util包中。 Java 的后续版本都添加了进一步的国际化功能。

然后,Java 国际化类被移植到 C++ 和 C ,称为 ICU4C(“ICU for C”)的库的一部分。 ICU 项目还提供了 ICU4J(“ICU for Java”),它添加了标准 Java 库中不存在的功能。 ICU4C 和 ICU4J 非常相似,但并不完全相同;例如,ICU4C 包含正则表达式的 API,而 ICU4J 则没有。随着时间的推移,这两个框架都得到了增强,以支持统一码和通用当地数据存储库的新功能。

1999 年,ICU 以开源项目的方式发布,原名称为 IBM Classes for Unicode,后来更名为 International Components For Unicode。 2016 年 5 月,ICU 项目加入统一码联盟成为其技术委员(),现在库源是以统一码许可来分发。

MessageFormat 是 ICU 中的类别,它是一个格式化系统,允许使用任意数量的参数来控制复数形式( pluralselectordinal ),或使用更一般的选择-切换样式(select)来处理如性的语法。这些语句可以嵌套。 ICU MessageFormat 是通过将复数和选择系统添加到Java SE中的同名系统而创建的。

相关

  • 烘烤烘焙(英语:Baking),又称焗烤、烘烤,是指面包、蛋糕、饼干、西点、派、挞、比萨饼、泡芙等烘烤类的食品制作技术,常见于西式烹饪,一般是用烤箱烤的。烘焙是制品在烤炉中经高温烘烤为
  • 艾叶艾草(学名:Artemisia argyi),又称作艾叶、艾、艾蓬、甜艾、香艾、冰台、艾蒿、灸草,是一种多年生草本植物,分布于亚洲及欧洲地区。多年生草本,揉之有香气;叶子羽状分裂,背面有白丝绒
  • 一个男人和一个女人《一个男人和一个女人》(法语:Un homme et une femme)是一部1966年的浪漫爱情法国电影,克劳德·勒鲁什担任影片的导演、制片人,而且还是编剧之一,尚-路易·特罕狄酿和阿努克·艾梅
  • 鹿兵鲇鹿兵鲇,为辐鳍鱼纲鲇形目美鲇科的其中一种,为热带淡水鱼。分布于南美洲巴西瓜波雷河流域,体长可达4.9公分,栖息在底层水域,生活习性不明,可做为观赏鱼。 维基物种中有关鹿兵鲇的数
  • 锡伯文锡伯文(锡伯语:ᠰᡞᠪᡝ ᡥᡝᠷᡤᡝᠨ,转写:)是锡伯语的文字,1947年前后由满文略加改造而成,是全音素文字。由上至下竖写,各列由左至右排列。下表列出锡伯文里和满文有区别的字母。
  • 青森县第3区青森县第3区是日本众议院的一个小选区,设于1994年。范围包括弘前市、五所川原市、黑石市、津轻市、平川市、西津轻郡、中津轻郡、南津轻郡、北津轻郡。北海道 13 | 山形县 4
  • 虚拟YouTuber虚拟YouTuber(日语:バーチャルユーチューバー,英语:Virtual YouTuber,也缩写为VTuber)是以YouTube为平台进行视频直播和投稿的虚拟偶像(日语:バーチャルアイドル),在YouTube以外的平台
  • 崎岖山的故事《崎岖山的故事》是一部由爱伦·坡于1844年所著的短篇小说,当时发布在Godey's Lady's Book上。故事主角贝罗德有一天上山,但其家人迟迟都未见他归来,直至晚上八时贝罗德才回家,
  • 长锁龙类长锁龙类(Leptocleidia)是蛇颈龙亚目的一个演化支,最初在2007年被命名为Leptocleidoidea亚科,事后在2010年被重新命名为Leptocleidia,以避免分类位阶上的冲突。目前范围包含长锁
  • 塞雷卡塞雷卡(Séléka)是中非共和国一个武装联盟,在2012年成立,主要由穆斯林组成,当中许多人是来自乍得和苏丹的雇佣兵。“塞雷卡”在桑戈语的意思是“联盟”,意指他们由争取团结民主力量联盟、争取正义与和平爱国者同盟等组织的成员组成。在成立初期,塞雷卡的领导人是米歇尔·乔托迪亚,武装人员估计有1000至2000人,而对抗他们的政府军兵力最多有3500人,然而政府军装备、训练不足,士气低落,无力抵挡叛军进攻。2013年1月11日,塞雷卡与中非共和国政府签署停火协议,同意共组联合过渡政府。2013年3月21日,塞