GB 18030-2000

✍ dations ◷ 2025-10-23 07:30:07 #GB 18030-2000
GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030共收录汉字70,244个。GB 18030主要有以下特点:GB 18030在微软视窗系统中的代码页为54936。GB 18030不是一个汉字规范,不定义汉字的写法。中国大陆在此方面的规定由通用规范汉字表管理。GB 18030 的当前版本为 GB 18030-2005。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施;是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。 本规格的初版“GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》”是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。在GBK基础上增加了CJK统一汉字扩充A的汉字。此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的少数中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。:4GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义,因此算得上是一种Unicode的变换格式(UTF)。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode,其变换和UTF-8相比要复杂得多。在日常实现上,常常会直接使用一个偏移量表。GB 18030—2005与GB18030—2000、GBK相比,去除了很多原来映射在PUA中的编码。后来剩余的24个PUA码位也在Unicode 4.1中加上,如下所示。GB 18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。GBK双字节部分通过查表定义,而四字节部分则根据之前两个部分没有提到的通用字符集码位顺序填补。由于和GBK兼容,GB 18030在搜索ASCII字符时也需要使用特别代码进行判断。一、二字节区块基本就是GBK编码,另外加上了专门的欧元字符、竖排版本的标点符号,以及造字区对Unicode造字区的对应。四字节区块可以视作两段形似GBK二字节区块结构的部分,每段的第一字节可以为0x81到0xFE,第二字节为0x30到0x39。由于结构类似,能够安全于GBK的字符串搜索程序对于GB 18030来说也基本安全(正如基于字节(英语:byte-oriented)的搜索程序对于EUC、UTF-8也基本安全一般。)四字节区块总共可以表达1,587,600(126×10×126×10)种字符,足以覆盖Unicode的1,112,064(17×65536 − 2048个代理对)个有效码位。由于四字节区块通过填空定义,要写出处理这段转换的程序需要同时知道GBK的覆盖范围,并不简单:WHATWG和W3C的GB 18030实现通过一张“位置偏移表”记录GB 18030四字节区中连续的几块碎片,以便高效处理转换。ICU和glibc也都对大块连续的区域使用了类似的策略。

相关

  • 蛋白酶蛋白酶(英语:protease)是生物体内的一类酶(酵素),它们能够分解蛋白质。分解方法是打断那些将氨基酸连结成多肽链的肽键。蛋白酶是重要的工业酶,占全球总酶销售量约六成,其中七成用于
  • NusinersenNusinersen(商品名为Spinraza)是第一个用于治疗脊髓性肌肉萎缩症的药物。脊髓性肌肉萎缩症是一种罕见的神经退化性疾病,其病因是自双亲遗传了功能低落或没有功能的SMN基因,因此
  • 伪装伪装是动物用来隐藏自己,或是欺骗其他动物的一种手段,不论是掠食者或是猎物,伪装的能力都会影响这些动物的生存几率,主要的方式包括了保护色、警戒色和拟态。以保护色而言,有些物
  • 泰雅语泰雅语(泰雅文:Atayal、Tayal),亦称泰雅尔语,是南岛语系的一种,用拉丁文字书写,为台湾泰雅族的民族语言。分布地域极广,一般学者将其与赛德克语一并归于泰雅语群(Atayalic)。目前台湾
  • 鱼素者鱼素主义(Pescetarianism)是指戒食红肉、禽类肉食,但仍进食海鲜(以鱼为主)的饮食习惯。鱼素者对各类型病菌、禽流感等疾病、肥胖、过敏等健康方面的担忧,因而放弃红白肉,改以鱼类来
  • 夜鹰目夜鹰目(学名:Caprimulgiformes)在动物分类学上是鸟纲中的一个目。这一目的鸟分布广泛,除了南极洲外各大洲都有分布。夜鹰目的学名 Caprimulgiformes 来自夜鹰属的属名 Caprimulg
  • Mk 19自动榴弹发射器Mk 19自动榴弹发射器(Mk 19 Automatic Grenade Launcher)是美军在越战时开始装备至今的一种40毫米口径弹链供弹的全自动榴弹发射器,由美国海军兵工站所开发,通用动力及萨科(Saco)
  • 夏威夷火山夏威夷火山国家公园(英语:Hawaiʻi Volcanoes National Park),成立于1916年8月1日。那里展示了数以十万年计的火山活动,地壳移动,与及独有的生态演化。该区拥有由海面至全球其中一
  • 卡波托马斯·理查德·“汤姆”·卡珀(Thomas Richard "Tom" Carper,1947年1月23日-),美国经济学家、政治人物,现任德拉瓦州资深联邦参议员,民主党籍。曾参与越南战争,担任过五任联邦众议
  • 廷德尔空军基地廷德尔空军基地(英语:Tyndall Air Force Base)是位于美国佛罗里达州贝县的一个人口普查指定地区。廷德尔空军基地的座标为30°04′43″N 85°34′35″W / 30.07861°N 85.57639