首页 >
字符
✍ dations ◷ 2025-05-15 20:39:01 #字符
在电脑和电信领域中,字符(Character)是一个信息单位。对使用字母系统或音节文字等自然语言,它大约对应为一个音位、类音位的单位或符号。简单来讲就是一个汉字、假名、韩文字……,或是一个英文、其他西方语言的字母。字符的例子有:字母、数字系统或标点符号。另外有所谓控制字符的概念,它是指:并不对应到自然语言中的某个特定符号,而是对应到语言中一些用来处理文句的概念(类似排版)。例子为打印机或其它显示设备的命令,如Enter或Tab。电脑和通信设备会在表示字符时,会使用字符编码。是指将一个字符对应为某个东西。传统上,是代表整数的比特序列,如此,则可透过网络来传输,同时亦便于存储。两个常用的例子是ASCII和用于Unicode编码的UTF-8。根据谷歌的统计,UTF-8是当前最常用于网页的编码方式。相较于大部分的字符编码把字符对应到数字或位串,摩斯密码则是使用不定长度的电子脉冲的序列来表现字符。从历史来说,“字符”这个辞汇在工业专业中被广泛用来指一个编码过的字符(通常用于程序设计语言的API)。同样地,字符集则被广泛指为那些对应到特定比特序列的抽象字符的集合。随着Unicode编码等未指定比特形式的字符编码的到来。更精确的术语获得愈来愈多的认同。对某些文件而言,区分一个字符是信息单位而非任何特定的视觉显示是很重要的。如Aleph(א)这个希伯来字母常用于数学中,表示某种无穷,但它同时又用于原本的希伯来文件中。在统一码中,尽管这两种用法有一样外形,但它们是不同的字符,而且由不同的码位来区分。相对地,如“水”这个中文表意文字,在日文文件会和中文文件中有些微不一样的外观,这会反映在不同地区的字体。但它们仍代表相同的信息,即视为一样的字符,并且在统一码中使用一样的码位。字形(Glyph)这个辞汇用于描述一个特定字符实质的外观。很多电脑字体包含许多字形,且由一个字符的统一码码位来对其字形做索引。Unicode标准(The Unicode Standard)和 通用字符集彼此定义“字符”和“抽象字符”为“用来组织、控制或表达数据的成分所组集合的成员之一”。统一码的定义则补充了一些解释用的注释,鼓励读者去区分字符、字位和字形。这个准则也区分抽象字符和“编码过的字符”,后者是指和数字编码成对,以利于电脑中的表示。
相关
- 普沙托韦普沙托韦(GS-5806,化学式C24H30ClN7O3S)是一种抗病毒药,被开发用于治疗呼吸道合胞病毒感染。它作为一种融合抑制剂,在II期临床试验中显示出较好的疗效。
- 人口论《人口论》(英语:An Essay on the Principle of Population),于1798年由人口学家马尔萨斯发表,为政治经济学的经典之作。人口学原理的基本思想是:马尔萨斯注意到许多人误用他的理
- 生殖器官生殖器官是指在复杂生物体上任何与有性繁殖及组成生殖系统有关的组织(严格意义上,不一定都属于器官)。另外有相关的性器官一词,广义地说是指会带来性快感的器官。生殖腺是指产生
- T波在心电图学中,T波(T wave)代表的是心室的再极化(英语:repolarization)。自QRS复合波(英语:QRS complex)的起点到T波的顶点这一段被称为绝对乏兴奋期(英语:refractory period (physiolog
- 损害损害,是伦理及法律概念。伯纳德·格特(英语:Bernard Gert)将损害包括:
- 米兹拉希犹太人米兹拉希犹太人(希伯来语:מזרחים,现代 Mizraḥim,提比里安 Mizrāḥîm,意为“东方人”),为居于中东、中亚和高加索地区的犹太人的后裔。现有人口约175万人,其中超过130万居于
- 教宗额我略一世教宗圣额我略一世(拉丁语:Sanctus Gregorius PP. I;约540年-604年3月12日)于590年9月3日至604年3月12日岀任教宗。他是以一致欢呼的方式当选教宗。教宗额我略一世出生于罗马。初
- 文本和数据挖掘文本挖掘有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常
- 甲状会厌肌甲状会厌肌(thyroepiglottic muscle)相当数量的甲杓肌的肌纤维被延长到杓状会厌襞;其中有些遗失,而其他的则继续延伸到会厌的边缘。甲状会厌肌有不同的英文名称:thyroepiglotticu
- 小字陶文 ‧ 甲骨文 ‧ 金文 ‧ 古文 ‧ 石鼓文籀文 ‧ 鸟虫书 ‧ 篆书(大篆 ‧ 小篆)隶书 ‧ 楷书 ‧ 行书 ‧ 草书漆书 ‧ 书法 ‧ 飞白书笔画 ‧