首页 >
GB 18030-2005
✍ dations ◷ 2025-10-21 02:05:01 #GB 18030-2005
GB 18030,全称《信息技术 中文编码字符集》,是中华人民共和国国家标准所规定的变长多字节字符集。其对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。GB 18030共收录汉字70,244个。GB 18030主要有以下特点:GB 18030在微软视窗系统中的代码页为54936。GB 18030不是一个汉字规范,不定义汉字的写法。中国大陆在此方面的规定由通用规范汉字表管理。GB 18030 的当前版本为 GB 18030-2005。现行版本为国家质量监督检验总局和中国国家标准化管理委员会于2005年11月8日发布,2006年5月1日实施;是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。
本规格的初版“GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》”是由中华人民共和国信息产业部电子工业标准化研究所起草,由国家质量技术监督局于2000年3月17日发布。在GBK基础上增加了CJK统一汉字扩充A的汉字。此标准内的单字节编码部分、双字节编码部分,和四字节编码部分收录的少数中日韩统一表意文字扩展A区汉字,为强制性标准。其他部分则属于规模性标准。在中华人民共和国境内所有软件产品,都需要支持这个同时包含单字节、双字节和四字节编码的规格。:4GB 18030在其标准中以码表形式定义了除去代理对外的全部Unicode码位的定义,因此算得上是一种Unicode的变换格式(UTF)。由于GB 18030基本上是绕开已分配的码点去指定需要对应的Unicode,其变换和UTF-8相比要复杂得多。在日常实现上,常常会直接使用一个偏移量表。GB 18030—2005与GB18030—2000、GBK相比,去除了很多原来映射在PUA中的编码。后来剩余的24个PUA码位也在Unicode 4.1中加上,如下所示。GB 18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。GBK双字节部分通过查表定义,而四字节部分则根据之前两个部分没有提到的通用字符集码位顺序填补。由于和GBK兼容,GB 18030在搜索ASCII字符时也需要使用特别代码进行判断。一、二字节区块基本就是GBK编码,另外加上了专门的欧元字符、竖排版本的标点符号,以及造字区对Unicode造字区的对应。四字节区块可以视作两段形似GBK二字节区块结构的部分,每段的第一字节可以为0x81到0xFE,第二字节为0x30到0x39。由于结构类似,能够安全于GBK的字符串搜索程序对于GB 18030来说也基本安全(正如基于字节(英语:byte-oriented)的搜索程序对于EUC、UTF-8也基本安全一般。)四字节区块总共可以表达1,587,600(126×10×126×10)种字符,足以覆盖Unicode的1,112,064(17×65536 − 2048个代理对)个有效码位。由于四字节区块通过填空定义,要写出处理这段转换的程序需要同时知道GBK的覆盖范围,并不简单:WHATWG和W3C的GB 18030实现通过一张“位置偏移表”记录GB 18030四字节区中连续的几块碎片,以便高效处理转换。ICU和glibc也都对大块连续的区域使用了类似的策略。
相关
- 甲羟戊酸途径甲羟戊酸途径(Mevalonate pathway)甲羟戊酸途径,也被称为异戊二烯途径(Isoprenoid pathway)或HMG-CoA还原酶(HMG-CoA reductase pathway)途径,是存在于真核生物,古菌和一些细菌中
- 非结晶无定形体,或称无定形体、无定形形固体,是其中的原子不按照一定空间顺序排列的固体,与晶体相对应。常见的无定形体包括玻璃和很多高分子化合物如聚苯乙烯等。只要冷却速度足够快
- 麦西热甫麦西热甫(维吾尔语:.mw-parser-output .font-uig{font-family:"UKIJ Tuz","UKIJ Nasq","UKIJ Basma","UKIJ_Mac Basma","UKIJ Zilwa","UKIJ Esliye","UKIJ Tuz Basma","UKIJ T
- 兰尼单抗兰尼单抗(英语:Ranibizumab,也译为雷珠单抗,商品名Lucentis)是一种单克隆抗体片段(FAB),其与贝伐单抗(bevacizumab)是从相同亲本鼠抗体获得。它比母体分子小得多,能更紧密的结合到血管
- 语义互操作性语义互操作性,又称为语义协同工作能力或者语义互用性,是互操作性的一种层次。IEEE(Institute of Electrical & Electronic Engineers,电气与电子工程师协会)对互操作性做出了如下
- t̪θʼ齿挤喉塞擦音(Dental ejective affricate)是一种辅音,出现于一些口语中。齿挤喉塞擦音的国际音标(IPA)写作⟨t͡θʼ⟩,其等价的X-SAMPA音标则记作t-\T_>.齿挤喉塞擦音的特征包括:
- 贾科尼里卡尔多·贾科尼(意大利语:Riccardo Giacconi,1931年10月6日-2018年12月9日),意大利裔美国天文学家,约翰霍普金斯大学教授,因在X射线天文学方面的先驱性贡献而获得2002年的诺贝尔物
- 李永得李永得(1955年5月30日-),台湾高雄县美浓镇福安里(今高雄市美浓区)人,曾任中华民国高雄市政府副市长,现任行政院客家委员会主任委员,在自立晚报任职记者时,奉报社要求,与徐璐在戒严时期
- 两小无猜条款两小无猜条款是1999年4月23日增订的中华民国法律条文,许多国家或地区都有类似的法律条文,意指年轻人因为年少轻狂,而触犯法定强奸者,得以减轻或免除其刑,或者由公诉变为告诉乃论
- 詹姆斯河詹姆斯河(英语:James River)是一条位于美国维吉尼亚州的河流,长达547.160公里(340英哩),是该州最大的河。它的源头在阿勒格尼山脉,河口在汉普顿锚地,最后经切萨皮克湾流入大西洋。当