ISO/IEC 8859

✍ dations ◷ 2025-11-05 09:53:23 #ISO/IEC 8859

ISO 8859,全称ISO 是国际标准化组织(ISO)及国际电工委员会(IEC)联合制定的一系列8位元字符集的标准,现时定义了15个字符集。

ASCII收录了空格及94个“可印刷字符”,足以给英语使用。但是,其他使用拉丁字母的语言(主要是欧洲国家的语言),都有一定数量的附加符号字母,故可以使用ASCII及控制字符以外的区域来储存及表示。

除了使用拉丁字母的语言外,使用西里尔字母的东欧语言、希腊语、泰语、现代阿拉伯语、希伯来语等,都可以使用这个形式来储存及表示。

1982年,ANSI与ECMA合作开启此项工作。1985年,公布了ECMA-94,即后来的ISO/IEC 8859 parts 1, 2, 3, 4。第5、6、7、8、9、10、11、12、13、14、15、16部分分别公布于1988年、1987年、1987年、1987年、1989年、1992年、2001年、1997年(正式宣布放弃研发)、1998年、1998年、1999年、2001年。

ISO 8859是基于ISO 2022标准的基础上,在ISO 2022规定的G0码位区域表示ISO 646的95个可打印字符;在C0与C1的控制字符码位区域,表示ISO 6429定义的控制字符;而在G1码位区域,则是由ISO 8859的16个部分各自定义扩展的可打印字符。因此,ISO 8859完全兼容7位的ASCII码。ISO 8859没有使用ISO 2022中的G2、G3区域,也不再使用ISO 2022定义的用来在不同的字符编码集或在同一个编码集的G0、G1、G2、G3区域间转换的“控制字符转义序列”。

ISO 8859统一了此前各国各语言的单独编码的混乱局面;废弃了ASCII/ISO 646使用的退格键开始的转义序列来表示变音字母的方法,而是在G1区域直接编码表示变音字母。

ISO 8859是在1980年代中期甚至1990年代才陆续公布的。因此,微软公司与IBM公司等此前已经在其产品,如MS-DOS, IBM PC上使用了各自定义的编码字符集(即“代码页”Codepage)。ISO 8859公布后,也出现了一些广泛使用的代码页兼容并扩充了ISO 8859。例如,Windows代码页1252作为英文及一些西欧语言版Windows操作系统的默认编码(locale),是 ISO 8859-1 的超集。主要扩充之处是把ISO 8859-1 的保留未用的C1区(即码位0x80-0x9F)用来编码一些可打印字符:€ ‚ ƒ „ … † ‡ ˆ ‰ Š ‹ Œ Ž ‘ ’ “ ” • – — ˜ ™ š › œ ž Ÿ 共计27个,其中各种引号就有8个。

由于英语没有任何重音字母(不计外来词),故可使用以上十五个字集中的任何一个来表示。

至于德语方面,因它除了 A-Z, a-z 外,只用 Ä, Ö, Ü, ä, ö, ß, ü 七个字母,而所有拉丁字集(1-4, 9-10, 13-16)均有此七个字母,故德语可使用以上十个字集中的任何一个来表示。

此系列中没有-12号的原因是,此计划原本要设计成一个包含塞尔特语族字符集的“Latin-7”,但后来塞尔特语族变成了ISO 8859-14 / Latin-8。亦有一说谓-12号本来是预留给印度天城体梵文的,但后来却搁置了。

每个字集定义最多96个字母或符号,在0xA0-0xFF根据不同字符集放入不同的字符。

在0xA0的位置是“不换行空格”。

在0xAD的位置,大部分都放入了“选择性连字号(英语:Soft hyphen)”(即只在一个文字在它的中间换行时才出现的连字号),若你使用的浏览器支援选择性连字号,上表将不会有任何显示。

黄色的是ISO/IEC 8859-7:2003版本及ISO/IEC 8859-8:1999版本新增的符号。LRM是“左至右符号”、RLM是“右至左符号”。

绿色的是该字集未有定义该位置。

0x00-0x1F、0x7F、0x80-0x9F在此字符集中未有定义。(控制字符是由ISO/IEC 6429定义)。

在ISO/IEC 8859-之中,国际标准化组织只替每个字符集定义了最多96个字符(0xA0-0xFF)。

ISO-8859-(在ISO与8859之间加上一连字号)则是由IANA根据ISO/IEC 8859-所定义的编码表。它除了ISO/IEC 8859-的字符外,还包括ASCII(0x20-0x7E)字符及65个控制字符(0x00-0x1F及0x7F-0x9F)。

这个号码本来是预留给印度天城体梵文的,但最终未有定义。印度有自己的编码-ISCII。

JIS X 0201是日语片假名的字符集标准,能与ISO 8859兼容。

VISCII是越南语在本土以外的侨民最常用的字符集标准。但因越南语有超过一百个重音字母,故不兼容ISO 8859。越南国家标准另有符合ISO8859标准的字符集,但字符需要组合,像泰文一样。

ISO 6438是非洲字母的字符集,但甚少被采纳。

ISO/IEC 8859 标准由 ISO/IEC 第一联合技术委员会第二分委员会第三工作组(ISO/IEC JTC 1/SC 2/WG 3)管理。2004 年 6 月,第三工作组解散,管理工作移交给第二分委员会。这份标准现在不再更新,因为这个分委员会唯一的工作组——第二工作组,正着力于ISO/IEC 10646的开发。

相关

  • 证明论证明论是数理逻辑的一个分支,它将数学证明表达为形式化的数学客体,从而通过数学技术来简化对他们的分析。证明通常用归纳式地定义的数据结构来表达,例如链表,盒链表,或者树,它们根
  • 日本食品标准成分表日本食品标准成分表(Standard Tables of Food Composition in Japan)现为日本文部科学省负责制定的一种食品成分表,作为医院和企业计算食物营养的标准。
  • diabetes世界糖尿病日代表符号“包 圈”(Universal blue circle symbol for diabetes.)糖尿病(拉丁语:diabetes mellitus,缩写为DM,简称diabetes)是一种代谢性疾病,它的特征是患者的血糖长
  • 顺风耳顺风耳,表意指“能够听到随风而来之声音的耳朵”。在中文语境中,顺风耳也于被用于形容听力好或者知道很多八卦传闻的人。于现代可以分为几个解释:在民间的神话传说中,替妈祖察听
  • 老鹰乐队老鹰乐团(Eagles)是20世纪70年代早期成立于美国洛杉矶的一支摇滚乐团,至今共发行7张专辑与29支单曲。乐团于1980年一度解散,于1994年重组,开始在各地进行的巡回演唱。乐团有5首头
  • 希腊国徽希腊国徽(希腊语:Εθνόσημο της Ελλάδας,转写:Ethnósimo tis Elládas)由一个蓝色的,上面有一个白十字的盾徽和两枝包围盾徽的橄榄枝构成。国徽主要被印或织在
  • 旅游教育出版社旅游教育出版社 (英语:Tourism Education Press)是一家位于北京的出版社,隶属于北京第二外国语学院。创建于1987年,主要出版旅游,外语类书籍。
  • 卢考特穹坐标:83°3′S 156°27′E / 83.050°S 156.450°E / -83.050; 156.450卢考特穹(英语:Lookout Dome)是南极洲的穹丘,位于奥次地,属于米勒山脉的一部分,海拔高度约2,470米,由新西兰探
  • 伯洛克峰坐标:86°3′S 132°20′W / 86.050°S 132.333°W / -86.050; -132.333伯洛克峰(英语:Burlock Peak)是南极洲的山峰,位于威尔克斯地,处于沃森海崖东面,海拔高度2,070米,美国地质调
  • 少女小渔 (小说)《少女小渔》为美籍华人作家严歌苓的小说。来自中国的小渔是在美国纽约一家工厂的女工,每周五天工作两天上学。她的男朋友江伟也是来自中国的学生,早上非法工作下午上学。她为了身份与意大利裔美国人马力欧假结婚,马力欧是个偶尔出门拉小提琴卖艺的七十多岁老头。马力欧的同居女友丽塔也是意大利裔美国人。因为美国移民局会派人确认“夫妻关系”,所以小渔就搬去马力欧的住所,但住所里有马力欧的女友丽塔,丽塔总是充满敌意地对待小渔,其实小渔和马力欧就像和长辈晚辈相敬如宾,并处处让著丽塔。另一方面,江伟总热潮冷讽地责怪小渔和马力欧互动