GB 18030-2000

✍ dations ◷ 2025-05-18 04:08:07 #GB 18030-2000
GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030共收录汉字70,244个。GB 18030主要有以下特点:GB 18030在微软视窗系统中的代码页为54936。GB 18030不是一个汉字规范,不定义汉字的写法。中国大陆在此方面的规定由通用规范汉字表管理。GB 18030 的当前版本为 GB 18030-2005。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施;是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。 本规格的初版“GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》”是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。在GBK基础上增加了CJK统一汉字扩充A的汉字。此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的少数中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。:4GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义,因此算得上是一种Unicode的变换格式(UTF)。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode,其变换和UTF-8相比要复杂得多。在日常实现上,常常会直接使用一个偏移量表。GB 18030—2005与GB18030—2000、GBK相比,去除了很多原来映射在PUA中的编码。后来剩余的24个PUA码位也在Unicode 4.1中加上,如下所示。GB 18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。GBK双字节部分通过查表定义,而四字节部分则根据之前两个部分没有提到的通用字符集码位顺序填补。由于和GBK兼容,GB 18030在搜索ASCII字符时也需要使用特别代码进行判断。一、二字节区块基本就是GBK编码,另外加上了专门的欧元字符、竖排版本的标点符号,以及造字区对Unicode造字区的对应。四字节区块可以视作两段形似GBK二字节区块结构的部分,每段的第一字节可以为0x81到0xFE,第二字节为0x30到0x39。由于结构类似,能够安全于GBK的字符串搜索程序对于GB 18030来说也基本安全(正如基于字节(英语:byte-oriented)的搜索程序对于EUC、UTF-8也基本安全一般。)四字节区块总共可以表达1,587,600(126×10×126×10)种字符,足以覆盖Unicode的1,112,064(17×65536 − 2048个代理对)个有效码位。由于四字节区块通过填空定义,要写出处理这段转换的程序需要同时知道GBK的覆盖范围,并不简单:WHATWG和W3C的GB 18030实现通过一张“位置偏移表”记录GB 18030四字节区中连续的几块碎片,以便高效处理转换。ICU和glibc也都对大块连续的区域使用了类似的策略。

相关

  • 纤维素酶纤维素酶是酶的一种,在分解纤维素时起生物催化作用。纤维素酶广泛存在于自然界的生物体中。细菌、真菌、动物体内等都能产生纤维素酶。一般用于生产的纤维素酶来自于真菌,比较
  • 四样植物住棚节四样植物 (希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova",
  • 强力胶水万能胶,又称快干胶、三秒胶、瞬间胶、502胶,所含作为组合剂的成分为氰基丙烯酸酯(Cyanoacrylate)。氰基丙烯酸酯是一系列物质的合称,譬如 2-氰基丙烯酸甲酯(Methyl-2-cyanoacrylat
  • 印第安纳印第安纳州(英语:State of Indiana)是美国的一个州,它的首府是印第安纳波利斯。印第安纳原意是印第安人的土地的意思。它的缩写是IN。在美国,一个来自印第安纳州的人不被称为印第
  • 法律渊源法的渊源,简称法源(sources of law ),基本含义是法的来源或法的栖身之所,亦称法律的形式,指在某特定国家或政权的法律存在形式。法的渊源一词发源于古罗马的Fontes juris,普遍使用
  • 乔·鲁特肯豪斯乔·鲁特肯豪斯(英语:Joe Lutkenhaus,1947年4月24日-),美国微生物学家、分子遗传学家和堪萨斯医学中心大学的免疫学家。鲁特肯豪斯生于艾奥瓦州迪科拉,1969年获得艾奥瓦州立大学学
  • 量子涨落在量子力学中,量子涨落(英语:quantum fluctuation。或量子真空涨落,真空涨落)是在空间任意位置对于能量的暂时变化。 从维尔纳·海森堡的不确定性原理可以推导出这结论。根据这
  • 桨足纲桨足纲(学名Remipedia)是分布于滨海地下含水层中的甲壳亚门动物,不具视力,族群遍布在目前已知的海盆,如加勒比海、大西洋、澳洲海域,最早发现的桨足纲为宾夕法尼亚纪的化石,不过
  • 日本传统艺能日本传统艺能是日本自古代流传下来艺术技能的泛称。自特定阶级的教养、娱乐、仪式、祭嗣等活动的特定形式而来,经系统化的传承而尚未消失的有形、无形之物,如诗歌、音乐、舞蹈
  • 畅游北京畅游时代数码技术有限公司(简称:畅游、搜狐畅游)是一家位于中国北京的在线游戏开发商和运营商,于2009年4月在纳斯达克全球精选市场上市。