GB 18030-2005

✍ dations ◷ 2025-12-01 16:43:02 #GB 18030-2005
GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030共收录汉字70,244个。GB 18030主要有以下特点:GB 18030在微软视窗系统中的代码页为54936。GB 18030不是一个汉字规范,不定义汉字的写法。中国大陆在此方面的规定由通用规范汉字表管理。GB 18030 的当前版本为 GB 18030-2005。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施;是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。 本规格的初版“GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》”是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。在GBK基础上增加了CJK统一汉字扩充A的汉字。此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的少数中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。:4GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义,因此算得上是一种Unicode的变换格式(UTF)。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode,其变换和UTF-8相比要复杂得多。在日常实现上,常常会直接使用一个偏移量表。GB 18030—2005与GB18030—2000、GBK相比,去除了很多原来映射在PUA中的编码。后来剩余的24个PUA码位也在Unicode 4.1中加上,如下所示。GB 18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。GBK双字节部分通过查表定义,而四字节部分则根据之前两个部分没有提到的通用字符集码位顺序填补。由于和GBK兼容,GB 18030在搜索ASCII字符时也需要使用特别代码进行判断。一、二字节区块基本就是GBK编码,另外加上了专门的欧元字符、竖排版本的标点符号,以及造字区对Unicode造字区的对应。四字节区块可以视作两段形似GBK二字节区块结构的部分,每段的第一字节可以为0x81到0xFE,第二字节为0x30到0x39。由于结构类似,能够安全于GBK的字符串搜索程序对于GB 18030来说也基本安全(正如基于字节(英语:byte-oriented)的搜索程序对于EUC、UTF-8也基本安全一般。)四字节区块总共可以表达1,587,600(126×10×126×10)种字符,足以覆盖Unicode的1,112,064(17×65536 − 2048个代理对)个有效码位。由于四字节区块通过填空定义,要写出处理这段转换的程序需要同时知道GBK的覆盖范围,并不简单:WHATWG和W3C的GB 18030实现通过一张“位置偏移表”记录GB 18030四字节区中连续的几块碎片,以便高效处理转换。ICU和glibc也都对大块连续的区域使用了类似的策略。

相关

  • PNS周边神经病变(英语:Peripheral neuropathy,缩写PN)俗称神经系统疾病,是指神经系统的疾病或异常状态下的神经系统 。虽然在大众文化中神经病常常是一种代替精神病的说法,但神经病实
  • 心像表象(心理图像),在大多数情况下,类似感知某些物体、事件、场景,不过对感官而言,感知对象实际上并不存在。 有些时候,尤其是在入眠期(英语:Hypnagogia)和半醒(半意识)(英语:Hypnopom
  • 柳百新柳百新(1935年6月10日-),中国材料科学家。生于上海,原籍江苏武进。1961年毕业于清华大学工程物理系。清华大学材料科学与工程系教授。2001年当选为中国科学院院士。
  • 第十八王朝第八第十第十八王朝,是古埃及新王国时期的第一个王朝,也是古埃及历史上最强盛的王朝之一。第十八王朝所处的时间大致是公元前16世纪至公元前13世纪(约公元前1570年-约公元前1293
  • 下丘臂下丘(Inferior colliculus,来源于拉丁语,字面意思为“下方的小山”)是中脑顶盖部的神经核团,左右各一,关于中线对称。下丘与上丘一起组成所谓的“四叠体”,是中脑背侧顶盖部一个显
  • 陪审员选任制度陪审员选任制度(jury selection),是指在实行陪审制的情况下,选择并委任陪审员的司法程序。在需要实行陪审制的诉讼程序(包括民事诉讼和刑事诉讼)中,首先需要从法院所在地的地区居民
  • 二齿兽类二齿兽下目(Dicynodontia)是群似哺乳爬行动物,属于兽孔目异齿亚目。二齿兽类是一群体型从大型到小型、长者两支长牙的草食性动物。它们也是最成功且多样性的兽孔目(不计算哺乳类
  • smallD/small-δ-葡萄糖酸内酯D-葡萄糖酸 δ-内酯(英语:Glucono delta-lactone)(简称“葡萄糖酸内酯”或“GDL”),在食品工业用作螯合剂,酸化剂等,其E编码为E575。它是D-葡萄糖酸的内酯形式。纯品为白色粉末状无
  • 第2位广东省各地级市人口列表列出广东省21个地级市历年的常住人口与户籍人口。人口普查年份的常住人口为人口普查数字,非人口普查年份的常住人口为年度人口抽样调查推算数字。户籍
  • 北军联邦军(Union Army),美国南北战争(美国内战)时期泛指北方联邦方面军队,亦称北军(Northern Army)、联邦陆军(Federal Army)、洋基佬(the Yankees)(南军以该词贬损和称呼北军)等。在美国