字符 (计算机科学)

✍ dations ◷ 2025-10-22 12:19:28 #字符编码,数据类型,数码字体排印

在电脑和电信领域中,字符(Character)是一个信息单位。对使用字母系统或音节文字等自然语言,它大约对应为一个音位、类音位的单位或符号。简单来讲就是一个汉字、假名、韩文字……,或是一个英文、其他西方语言的字母。

字符的例子有:字母、数字系统或标点符号。另外有所谓控制字符的概念,它是指:并不对应到自然语言中的某个特定符号,而是对应到语言中一些用来处理文句的概念(类似排版)。例子为打印机或其它显示设备的命令,如Enter或Tab。

电脑和通信设备会在表示字符时,会使用字符编码。是指将一个字符对应为某个东西。传统上,是代表整数的比特序列,如此,则可透过网络来传输,同时亦便于存储。两个常用的例子是ASCII和用于Unicode编码的UTF-8。根据谷歌的统计,UTF-8是目前最常用于网页的编码方式。 (页面存档备份,存于互联网档案馆)相较于大部分的字符编码把字符对应到数字或位串,摩斯密码则是使用不定长度的电子脉冲的序列来表现字符。

从历史来说,“字符”这个辞汇在工业专业中被广泛用来指一个编码过的字符(通常用于程序设计语言的API)。同样地,字符集则被广泛指为那些对应到特定比特序列的抽象字符的集合。随着Unicode编码等未指定比特形式的字符编码的到来。更精确的术语获得愈来愈多的认同。

对某些文件而言,区分一个字符是信息单位而非任何特定的视觉显示是很重要的。如Aleph(א)这个希伯来字母常用于数学中,表示某种无穷,但它同时又用于原本的希伯来文件中。在统一码中,尽管这两种用法有一样外形,但它们是不同的字符,而且由不同的码位来区分。相对地,如“水”这个中文表意文字,在日文文件会和中文文件中有些微不一样的外观,这会反映在不同地区的字体。但它们仍代表相同的信息,即视为一样的字符,并且在统一码中使用一样的码位。

字形(Glyph)这个辞汇用于描述一个特定字符实质的外观。很多电脑字体包含许多字形,且由一个字符的统一码码位来对其字形做索引。

Unicode标准(The Unicode Standard)和 通用字符集彼此定义“字符”和“抽象字符”为“用来组织、控制或表达资料的成分所组集合的成员之一”。统一码的定义则补充了一些解释用的注释,鼓励读者去区分字符、字位和字形。这个准则也区分抽象字符和“编码过的字符”,后者是指和数字编码成对,以利于电脑中的表示。

相关

  • 爱德华·马基爱德华·约翰·“埃德”·马基(英语:Edward John "Ed" Markey、1946年7月11日-),是一位美国民主党政治人物,自2005年成为马萨诸塞州联邦参议院议员。他在美国参议院的2013年特别选
  • 中央军委主席中央军委主席一般指下列军队统帅:也可以指:其他类似的职务还有:
  • 卡尔克布雷纳弗里德里希·威尔海姆·卡尔克布雷纳(德语:Friedrich Wilhelm Kalkbrenner ,1785年11月7日-1849年6月10日),德国钢琴家,作曲家。早年在巴黎音乐学院学习,后来成为欧洲一流的钢琴家,晚
  • 阳西县阳西县是中国广东省阳江市下辖的一个县。2011年,阳西生产总值为102.55亿元,人均生产总值22438元,地方公共财政预算收入2.86亿元。下辖8个镇:织
  • 水果凝乳水果凝乳(英语:Fruit curd)是一种用柠檬、青柠、橙子、橘子等柑橘类制作的点心。现在也有用百香果、芒果、树莓、小红莓、黑莓制作。基本材料是蛋黄、砂糖、果汁、果皮。做法是
  • 秦似秦似(1917年10月15日-1986年1986年),原名王缉和、王扬,笔名茹雯、思秩、余士根、令狐厚、徐曼、姜一、王砚新、杨步飞等,广西博白人,中国作家、翻译家、编辑,《南方日报》原主编,广西
  • 常仲连常仲连(1914年-2010年),男,河南孟县人,中华人民共和国军事人物,中国人民解放军少将,曾任沈阳空军高炮指挥部司令员,沈阳军区空军副司令员。
  • 邹加怡邹加怡(1963年6月-),女,江苏无锡人,中华人民共和国政治人物。1984年2月加入中国共产党。先后毕业于国际关系学院和中国社会科学院研究生院,获经济学硕士学位。之后长期在财政部任职
  • 日本-拉丁美洲关系日本-拉丁美洲关系,指的是日本与拉丁美洲诸国之间从19世纪持续至今的关系。在拉丁美洲地区,日本与秘鲁、巴西等国家有着悠久的外交关系。自19世纪末以来,大量的日本人涌进拉丁美
  • 沩水河沩水河(“沩水”),即沩江、沩河,古名“玉潭江”,湘江下游西侧一级支流,位于湖南省长沙市境内,发源于沩山。分南北两源,南源出扶王山西麓大托里,北原出灯窝塞北麓大沙坪;两源于黄材水库