中文乱码

✍ dations ◷ 2025-05-19 02:54:00 #中文信息处理

中文乱码是中文系统的一种现象,这在过去未有一套统一的中文内码标准时,情况尤其严重。而随着互联网的普及,两岸之间或世界各地用户交流之际,乱码现象亦都会去了解因为各方使用的内码不同而产生相冲的现象。

在过去,由于繁体中文用户缺乏一个具有号召力的内码标准,不同用户都会使用各自的标准。比较普遍的是银行由于主要使用IBM的商业电脑,很自然的亦选择了IBM5550作为其内码标准。这些用5550内码的文件,一旦下载到微机上,若要转寄与其他人使用,就要透过转码换成Big5,其他人才可以阅读。

另一方面,在会计界有不少人都直接使用外国的专门软件,而为免冲码问题而使画面凌乱,不少的IT部门都把公司电脑的内码换成倚天码。本来会计人员过去只是把计算结果打印而提交报告,并未有任何问题。到后来随着电子表格的兴起,用户才发觉到当公司与外界使用的内码不同,会引起不少问题,才开始有人正视这问题。

随着UTF-8的普及化,许多繁体中文的IRC频道也逐渐从Big5转变成UTF-8;然而在这种过渡时期中,仍然有不少IRC频道是采用Big5的,所以用户参与了新的频道时,通常会想要先确定自己的字符编码有没有设错,人们最常用的测试字眼不外乎:

在Unicode编码与简体中文编码系统(例如GB2312、GBK、GB18030、CP936)转换时,部分简体中文编码的文字在Unicode编码中并不存在,Unicode会以“未识别字符(U+FFFD)”作为内码记录,而对外以UTF-8表现为“0xEF0xBF0xBD”,当多个“0xEF0xBF0xBD”连续出现,而且以简体中文编码去解释的话,就会被解析为多个“锟斤拷”。(锟(0xEFBF)、斤(0xBDEF)、拷(0xBFBD))

过往,乱码所产生的问题,往往只是阅读上的不方便,因为文字变成了乱码,使用户看不到文字的内容。然而,现时由于电脑软件保安设计的问题,乱码随时可能会使应用程序不正常关闭。

相关

  • 假根假根是植物和真菌的一种结构,和根一样用做支撑或吸收等用途。在真菌里,假根是由固定真菌的匍匐枝向下长的小小分歧菌丝。假根会释放出消化酶并吸收消化后的有机物质。在陆生植
  • 国歌《自由颂》(希腊语:Ύμνος εις την Ελευθερίαν,拉丁字母转写:Ímnos is tin Eleftherían)本来是一首有158节的诗,迪奥尼西欧斯·所洛莫斯在1823年著成,尼古劳
  • 联合国安理会常任理事国联合国安全理事会常任理事国是联合国安全理事会中的常任成员(俗称五常),五个创始成员国是二战期间同盟国中的五大国。其中,中国和俄罗斯的代表政权曾有所改变。中国原由中华民国
  • 赛洛新脱磷酸裸盖菇素是一种致幻性蘑菇生物碱,与磷酸化的裸盖菇素共见于多数迷幻蘑菇中。在中华人民共和国是第一类精神药品。其精神作用多变,一般作用时间在3-8小时。可由裸盖菇素
  • 白益王朝白益王朝(波斯语:آل بویه‎ Āl-e Buye,或译布韦希王朝、布耶王朝)是945年至1055年间统治伊朗西部及伊拉克的一个王朝,由里海南岸(吉兰省)的德莱木人建立。王朝名称来自创建
  • 浮华世界《名利场》(Vanity Fair: A Novel without a Hero)是英国小说家威廉·梅克比斯·萨克雷的讽刺小说,于1847年出版,并曾多次改编成电影与电视剧,生性狡诈虚荣的女主人翁利蓓加·夏
  • 邓桥村山东省茌平县博平镇邓桥村 邓桥是明代以前的老户村,明洪武年间,刘德英迁居邓桥,清道光年间,《博平县志》图标注的邓桥处在徒骇河上,设有水闸,现在仍建有桥与节制闸,以控制老徙河
  • 公式小说在流行文化中,公式小说是指故事主线和情节已被使用了很多次,而使得故事变得可预料的一种文学。“公式小说”多被使用在文学评论之中,带有意指其缺乏原创性的些微轻蔑。公式小说
  • Ally金融公司Ally金融公司(Ally Financial Inc.),前身为通用汽车金融服务公司(General Motors Acceptance Corporation,简写GMAC),当时为通用汽车的财务部门。目前总部位于美国密歇根州底特律,在
  • 羽多野涉羽多野涉(1982年3月13日-)是日本的男性声优、歌手。长野县东筑摩郡朝日村出身,身高171cm。血型为O型。隶属于81 Produce事务所。※粗体字为主要角色2001年2003年2004年2005年200