GB 18030-2000

✍ dations ◷ 2025-07-19 12:47:15 #GB 18030-2000
GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030共收录汉字70,244个。GB 18030主要有以下特点:GB 18030在微软视窗系统中的代码页为54936。GB 18030不是一个汉字规范,不定义汉字的写法。中国大陆在此方面的规定由通用规范汉字表管理。GB 18030 的当前版本为 GB 18030-2005。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施;是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。 本规格的初版“GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》”是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。在GBK基础上增加了CJK统一汉字扩充A的汉字。此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的少数中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。:4GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义,因此算得上是一种Unicode的变换格式(UTF)。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode,其变换和UTF-8相比要复杂得多。在日常实现上,常常会直接使用一个偏移量表。GB 18030—2005与GB18030—2000、GBK相比,去除了很多原来映射在PUA中的编码。后来剩余的24个PUA码位也在Unicode 4.1中加上,如下所示。GB 18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。GBK双字节部分通过查表定义,而四字节部分则根据之前两个部分没有提到的通用字符集码位顺序填补。由于和GBK兼容,GB 18030在搜索ASCII字符时也需要使用特别代码进行判断。一、二字节区块基本就是GBK编码,另外加上了专门的欧元字符、竖排版本的标点符号,以及造字区对Unicode造字区的对应。四字节区块可以视作两段形似GBK二字节区块结构的部分,每段的第一字节可以为0x81到0xFE,第二字节为0x30到0x39。由于结构类似,能够安全于GBK的字符串搜索程序对于GB 18030来说也基本安全(正如基于字节(英语:byte-oriented)的搜索程序对于EUC、UTF-8也基本安全一般。)四字节区块总共可以表达1,587,600(126×10×126×10)种字符,足以覆盖Unicode的1,112,064(17×65536 − 2048个代理对)个有效码位。由于四字节区块通过填空定义,要写出处理这段转换的程序需要同时知道GBK的覆盖范围,并不简单:WHATWG和W3C的GB 18030实现通过一张“位置偏移表”记录GB 18030四字节区中连续的几块碎片,以便高效处理转换。ICU和glibc也都对大块连续的区域使用了类似的策略。

相关

  • S01ADA·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码S01(Ophthalmologicals)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO C
  • 年假年假也称年休,指的是劳工每年在公共假日以外,能够自由安排的有薪假日。大多数国家都有劳动权益保护法律规定雇员最低的年休天数。根据雇主的规定,雇员可能须要在指定的天数前预
  • 植物分类表 (NCBI)NCBI是美国国家生物技术信息中心,其分类方法一般吸收了最新的科学进展,能被全世界的生物界所接受。本列表仅列出有胚植物(Embryophyta)部分,所有分类单元均分至科。以下所有有胚
  • ɣ浊软颚擦音是辅音的一种。其国际音标的符号是⟨ɣ⟩,X-SAMPA音标的符号则是⟨G⟩。大部分音韵学家把中古汉语的匣母构拟成浊舌根擦音,但也有一部分构拟为浊声门擦音。类似英语
  • 挪威海挪威海(挪威语:Norskehavet;法罗语:Norskahavið)是北大西洋的一个陆缘海,位于挪威西北方对开,介乎北海与格陵兰海之间。挪威海西边与冰岛海连接,东北方与巴伦支海相邻。在西南方,冰
  • 铁翼雄风《铁翼雄风》(英语:Wings)是一部于1927年由美国派拉蒙电影公司制作的黑白默片。它是第一部获得奥斯卡最佳影片奖的电影,也是唯一一部获得这个奖项的默片,一直到21世纪时艺术家获
  • 虚粒子虚粒子(英语:virtual particle),意即虚构粒子、假想粒子,是在量子场论的数学计算中建立的一种解释性概念,指代用来描述亚原子过程例如撞击过程中粒子的数学项。但是,虚粒子并不直接
  • 刘兆麒刘兆麒(1629年-1708年),字瑞图,清初政治人物,顺天府宝坻县(今天津市宝坻县)人。入汉军籍。清崇德七年(明崇祯十五年,1642年)官学生。顺治七年(1650年)授秘书院编修。顺治十一年(1654年)改都
  • 南美烤饺子恩潘纳达(西班牙语:empanada;波兰语:pastel;海地克里奥尔语:pate)是一种流行于伊比利亚半岛和拉丁美洲的糕点食物。馅饼的其中一种。恩潘纳达一词来自于西班牙语和葡萄牙语动词“em
  • 柑橘属柑橘属(学名:Citrus),或写作柑桔属,属于芸香科,包括柚、柑、橘、橙、柠檬、枳、金橘等,在世界上主要分布在北纬35°以南的区域。 包含一般熟知的柑橘类水果。而柑橘属中有不少野生