GB 18030-2000

✍ dations ◷ 2025-04-25 19:08:59 #GB 18030-2000
GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030共收录汉字70,244个。GB 18030主要有以下特点:GB 18030在微软视窗系统中的代码页为54936。GB 18030不是一个汉字规范,不定义汉字的写法。中国大陆在此方面的规定由通用规范汉字表管理。GB 18030 的当前版本为 GB 18030-2005。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施;是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。 本规格的初版“GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》”是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。在GBK基础上增加了CJK统一汉字扩充A的汉字。此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的少数中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。:4GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义,因此算得上是一种Unicode的变换格式(UTF)。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode,其变换和UTF-8相比要复杂得多。在日常实现上,常常会直接使用一个偏移量表。GB 18030—2005与GB18030—2000、GBK相比,去除了很多原来映射在PUA中的编码。后来剩余的24个PUA码位也在Unicode 4.1中加上,如下所示。GB 18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。GBK双字节部分通过查表定义,而四字节部分则根据之前两个部分没有提到的通用字符集码位顺序填补。由于和GBK兼容,GB 18030在搜索ASCII字符时也需要使用特别代码进行判断。一、二字节区块基本就是GBK编码,另外加上了专门的欧元字符、竖排版本的标点符号,以及造字区对Unicode造字区的对应。四字节区块可以视作两段形似GBK二字节区块结构的部分,每段的第一字节可以为0x81到0xFE,第二字节为0x30到0x39。由于结构类似,能够安全于GBK的字符串搜索程序对于GB 18030来说也基本安全(正如基于字节(英语:byte-oriented)的搜索程序对于EUC、UTF-8也基本安全一般。)四字节区块总共可以表达1,587,600(126×10×126×10)种字符,足以覆盖Unicode的1,112,064(17×65536 − 2048个代理对)个有效码位。由于四字节区块通过填空定义,要写出处理这段转换的程序需要同时知道GBK的覆盖范围,并不简单:WHATWG和W3C的GB 18030实现通过一张“位置偏移表”记录GB 18030四字节区中连续的几块碎片,以便高效处理转换。ICU和glibc也都对大块连续的区域使用了类似的策略。

相关

  • 社可指:
  • 互联网以下是截至2017年互联网用户数量的国家列表。互联网用户定义为过去12个月内从任何设备(包括移动电话)访问互联网的人员。注1:渗透率是每个国家/地区中互联网用户占总人口的百分
  • 斗六市坐标:23°42′27″N 120°32′38″E / 23.70750°N 120.54389°E / 23.70750; 120.54389斗六市(台湾话:.mw-parser-output .sans-serif{font-family:-apple-system,BlinkMacSys
  • 育空地区育空(英语、法语:Yukon)是加拿大三个地区/领地之一,位于加拿大的西北方。1898年6月13日,育空正式加入加拿大联邦。根据2016年的人口普查,育空人口有35,874人,其中25,085人,70%的人居
  • 首长首长可以指:
  • 国会法案法案(英语:Bill)是指被美国国会中众议院或参议院审议的立法提案。两院的任何议员都可以提出法案。国会批准一项法案后,其将送交美国总统审议,当总统签署法案后,其即成为具有效力的
  • 外生菌根菌根(希腊语:μυκός, mykós, "fungus",和ρίζα, riza, "root",,英语:mycorrhiza,复数形式mycorrhizae或mycorrhizas)指的是维管束植物的根与真菌组成的共生关系体。 它菌
  • 通加斯通加斯国家森林(英语:Tongass National Forest)位于阿拉斯加狭地,是全美国最大的国家森林。林地面积17 × 106英亩(69,000平方千米),其中大部分是世界自然基金会生态区的温带雨林,
  • 大阪港大阪港,位在大阪府大阪市的港湾。是日本主要的国际贸易港(五大港)之一,与神户港一同被指定为超级中枢港湾‘阪神港’。1868年、大阪市开市时一起开港。主要位置在港区、大正区、
  • 壮傣语支泰语支(又称傣语支、台语支、壮傣语支、壮泰语支、壮台语支)是壮侗语系侗台语族中的一个语支,即汉藏语系传统分类中壮侗语族壮傣语支的语言。包括壮语、布依语、傣语(在中国境内