全角和半角

✍ dations ◷ 2025-07-07 08:12:50 #Unicode区段,字元编码

全角和半角是文字的两种显示形式,“全角”指文字字身长宽比为一比一的正方形,而“半角”为宽度为全角一半的文字。现在这两个词通常用来指代计算机中显示的文字。

在传统的字体排印学中,文字字身长宽比为1比1的正方形金属铅字原本称作“全身”,而宽度只有一半的称为“半身”。另外对于小于一个“全身”的各种铅空称为“分空”,通常称为“二分空”(注意不是“半身”)“三分空”“四分空”“六分空”等等。

“半角/全角”源于日文,其中“角”是“方块”的意思,“全角/半角”在日文里即是原本“正方形/半个正方形大小文字”的本意,与西文字体排印学中Em和En单位含义相同。

而中文里的“角”虽然有“角度”“角落”等含义,却没有“方块”的意思,中文在字体排印时不说“全角/半角”而说“全身/半身”。中文里说“半角/全角”是计算机文字编码技术引入时直接借用了日文的做法。

而当前对于计算机上的文字称作“全角字”“全角字”的指代非常混乱,可能是指 (1) 用两个字节存储的字符、(2) ASCII(所谓半角英文和数字)以外所有的字符、(3) 显示上字身宽度为一比一正方形的字形。

为了避免混乱,在使用“字宽”的本意时,可以使用从英文倒翻译回中文的“全宽/半宽”(fullwidth/halfwidth)。

而在早期的计算机中,英语或拉丁字母语言使用的系统,每一个字母或符号,都是使用一字节的空间(一字节由8比特组成,共256个编码空间)来储存;而汉语、日语及韩语文字,由于数量大大超过256个,故惯常使用两字节来储存一个字符。所以这原本是编码层面的“单字节”“双字节”的问题。

当时使用等宽字体(如DOS、部分文字编辑器等)时,字体也就顺应这种编码形式,将中日韩文字的宽度绘制成拉丁字母和数字的两倍,这样字符的编码存储和显示宽度可以一一对应起来,“单字节”文字显示成“半宽”,“双字节”文字显示成“全宽”。因此当时的用户就开始习惯称中、日、韩等文字为“全角字符”,而称拉丁字母或数字为“半角字符”。

但是,后来计算机的文字编码技术已经发生很大变化,存储一个字符可能用一个、两个、四个或者更多的字节。一个英文字符即使显示为半宽,依照不同的编码方式,并不一定是用一个字节存储;而日文的片假名也不一定是双字节,也可能用一个字节存储(即“半角片假名”)。因此,现在字符编码存储和字符显示宽度的已经没有一一对应关系。

但是由于字符编码和字形宽度曾经的对应关系,很多用户一直习惯性地使用“全角/半角”词汇。“全角字”“全角字”可能是指 (1) 用两个字节存储的字符、(2) ASCII(所谓半角英文和数字)以外所有的字符、(3) 显示上字身宽度为一比一正方形的字形。

而在说“半角字”“半角字”时可能指 (1) 用单字节存储的字符(可能包括片假名)、(2) ASCII 字符即拉丁字母、数字和常见符号(而事实上并不一定是用单字节存储,根据不同的字体会显示成全宽、或者是西文的“比例宽度”而并不是正好“半宽”)、(3) 显示上字身宽度为字体高度一半的字形)。

Unicode 标准的附件11 (UAX#11) 中以信息性附件 (informative) 的形式,定义了东亚文字的字宽 East_Asian_Width 特性。



OpenType字体格式里定义了fwidhalthwidvhalGSUB特性,可以为同样一个编码(码位)的字符供替换成不同的字形(显示形式)。

相关

  • 常任理事国联合国安全理事会常任理事国是联合国安全理事会中的常任成员(俗称五常),五个创始成员国是二战期间同盟国中的五大国。其中,中国和俄罗斯的代表政权曾有所改变。中国原由中华民国
  • 班加西坐标:32°05′41″N 20°11′16″E / 32.0947711°N 20.1879106°E / 32.0947711; 20.1879106班加西(阿拉伯语:بنغازي‎)是位于利比亚北部锡德拉湾沿岸的一座港口城市,也是
  • 肉桂酸肉桂酸(英语:Cinnamic acid,IUPAC名:(E)-3-苯基-2-丙烯酸),分子式为C6H5CHCHCOOH。是微溶于水的白色结晶化合物。归类为不饱和羧酸,它天然存在于许多植物。它易溶于许多有机溶剂。
  • 莨菪碱天仙子胺(Hyoscyamine)是一种托烷类生物碱,作为次级代谢产物存在于天仙子,曼德拉草,曼陀罗花,番茄和颠茄等茄科植物。药物阿托品就是天仙子胺经提取处理后得到的消旋产物,因此天仙
  • C10A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码C10(血脂调节剂)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collabor
  • 特丁津特丁津(英语:Terbuthylazine)是一种选择性的除草剂,在化学上属于氯三嗪类,结构和莠去津(草脱净)或西玛津类似,不同之处在于叔丁基基团取代了两者相同位置的异丙基或乙基基团。
  • 劳亚古陆劳亚大陆(英文名:Laurasia)又译劳拉西亚大陆,为地质史古陆之一,存在于侏罗纪到白垩纪。劳亚大陆包含现今北半球大部分陆地。由劳伦大陆、波罗地大陆、西伯利亚大陆、哈萨克大陆、
  • 奉系奉系是民国军阀派系,属于北洋系,先后以张作霖和其子张学良为首,并一度成为中国境内最大的军政府。20世纪初,奉系张作霖接受招安。:363奉系受到日本支持。1918年,张作霖统一满洲。
  • 勃朗宁自动步枪勃朗宁自动步枪(英语:Browning Automatic Rifle,简称:BAR),是美军在20世纪上半叶使用的一种自动步枪。在第一次世界大战期间,美国军队参战后发现,在欧洲大陆环境恶劣的堑壕战中,他们
  • 鳇(学名:Huso dauricus,称作“达氏鳇”)为鲟科鳇属的鱼类,俗名鳇鱼。最大可长达5.6米、重达1000千克以上,世界上最大的淡水鱼之一。分布于前苏联地区以及黑龙江中游、乌苏里江、松