首页 >
GB 18030-2005
✍ dations ◷ 2025-07-19 03:52:36 #GB 18030-2005
GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030共收录汉字70,244个。GB 18030主要有以下特点:GB 18030在微软视窗系统中的代码页为54936。GB 18030不是一个汉字规范,不定义汉字的写法。中国大陆在此方面的规定由通用规范汉字表管理。GB 18030 的当前版本为 GB 18030-2005。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施;是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。
本规格的初版“GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》”是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。在GBK基础上增加了CJK统一汉字扩充A的汉字。此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的少数中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。:4GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义,因此算得上是一种Unicode的变换格式(UTF)。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode,其变换和UTF-8相比要复杂得多。在日常实现上,常常会直接使用一个偏移量表。GB 18030—2005与GB18030—2000、GBK相比,去除了很多原来映射在PUA中的编码。后来剩余的24个PUA码位也在Unicode 4.1中加上,如下所示。GB 18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。GBK双字节部分通过查表定义,而四字节部分则根据之前两个部分没有提到的通用字符集码位顺序填补。由于和GBK兼容,GB 18030在搜索ASCII字符时也需要使用特别代码进行判断。一、二字节区块基本就是GBK编码,另外加上了专门的欧元字符、竖排版本的标点符号,以及造字区对Unicode造字区的对应。四字节区块可以视作两段形似GBK二字节区块结构的部分,每段的第一字节可以为0x81到0xFE,第二字节为0x30到0x39。由于结构类似,能够安全于GBK的字符串搜索程序对于GB 18030来说也基本安全(正如基于字节(英语:byte-oriented)的搜索程序对于EUC、UTF-8也基本安全一般。)四字节区块总共可以表达1,587,600(126×10×126×10)种字符,足以覆盖Unicode的1,112,064(17×65536 − 2048个代理对)个有效码位。由于四字节区块通过填空定义,要写出处理这段转换的程序需要同时知道GBK的覆盖范围,并不简单:WHATWG和W3C的GB 18030实现通过一张“位置偏移表”记录GB 18030四字节区中连续的几块碎片,以便高效处理转换。ICU和glibc也都对大块连续的区域使用了类似的策略。
相关
- 炎症性肠病炎症性肠病、发炎性肠道疾病(英语:Inflammatory Bowel Disease, 简称IBD)是一组特定的肠道慢性疾病的统称,主要包括克隆氏症和溃疡性结肠炎两种。炎症性肠病的主要分为克罗恩病
- 酿酒酵母酿酒酵母(学名:Saccharomyces cerevisiae,又称面包酵母或者啤酒酵母,出芽酵母。酿酒酵母是与人类关系最广泛的一种酵母,不仅因为传统上它用于制作面包和馒头等食品及酿酒,在现代分
- 嘌呤代谢许多生物利用代谢途径来合成或分解嘌呤。嘌呤在生物合成中会合成为核苷酸,特别是核糖核苷酸,即核糖-5-磷酸。 主要的调节步骤为PRPP合成酶产生磷酸核糖焦磷酸(PRPP)的反应,这个
- 子弹子弹(英语:cartridge,也称round,霰弹枪弹则称为shell),又称定装弹药,是一种将弹头/散弹、推进药、底火整合在弹壳中以方便装填于火器类枪械的膛室中并进行发射的弹药。子弹是后膛火
- 小鼠属30 个物种,见内文小鼠属(学名:Mus)也称鼠属、鼷鼠属,是啮齿目鼠科的一属,当中最常见的是小家鼠(Mus musculus)。它几乎在所有的国家都能找到,例如在生物学研究中作为模式生物(Model o
- 西卡森西卡森(英语:West Carson)是位于美国加利福尼亚州洛杉矶县的一个人口普查指定地区。西卡森的座标为33°49′35″N 118°17′33″W / 33.82639°N 118.29250°W / 33.82639; -11
- 卡拉巴萨斯卡拉巴萨斯(英文:Calabasas),是美国加利福尼亚州洛杉矶县下属的一座城市,位于圣费尔南多谷以西、圣莫尼卡山的西北方,毗邻阿古拉山、希登希尔斯、马里布。建市于1991年4月5日,面积
- 西哥特王国西哥特王国(拉丁语:Hispania Visigothica),从5世纪到8世纪,由西哥特人在罗马帝国阿基坦高卢行省境内创建并扩张到整个伊比利亚半岛的一个国家。公元507年,西哥特人被克洛维一世领
- 福特级航空母舰杰拉尔德·R·福特级航空母舰(Gerald R. Ford-class aircraft carriers,简称福特级航空母舰)是美国海军最新的次世代超级航空母舰,也是美国海军第三代核动力航空母舰。在同级一
- 猫 (消歧义)猫可以指: