首页 >
字符
✍ dations ◷ 2025-11-26 09:58:42 #字符
在电脑和电信领域中,字符(Character)是一个信息单位。对使用字母系统或音节文字等自然语言,它大约对应为一个音位、类音位的单位或符号。简单来讲就是一个汉字、假名、韩文字……,或是一个英文、其他西方语言的字母。字符的例子有:字母、数字系统或标点符号。另外有所谓控制字符的概念,它是指:并不对应到自然语言中的某个特定符号,而是对应到语言中一些用来处理文句的概念(类似排版)。例子为打印机或其它显示设备的命令,如Enter或Tab。电脑和通信设备会在表示字符时,会使用字符编码。是指将一个字符对应为某个东西。传统上,是代表整数的比特序列,如此,则可透过网络来传输,同时亦便于存储。两个常用的例子是ASCII和用于Unicode编码的UTF-8。根据谷歌的统计,UTF-8是当前最常用于网页的编码方式。相较于大部分的字符编码把字符对应到数字或位串,摩斯密码则是使用不定长度的电子脉冲的序列来表现字符。从历史来说,“字符”这个辞汇在工业专业中被广泛用来指一个编码过的字符(通常用于程序设计语言的API)。同样地,字符集则被广泛指为那些对应到特定比特序列的抽象字符的集合。随着Unicode编码等未指定比特形式的字符编码的到来。更精确的术语获得愈来愈多的认同。对某些文件而言,区分一个字符是信息单位而非任何特定的视觉显示是很重要的。如Aleph(א)这个希伯来字母常用于数学中,表示某种无穷,但它同时又用于原本的希伯来文件中。在统一码中,尽管这两种用法有一样外形,但它们是不同的字符,而且由不同的码位来区分。相对地,如“水”这个中文表意文字,在日文文件会和中文文件中有些微不一样的外观,这会反映在不同地区的字体。但它们仍代表相同的信息,即视为一样的字符,并且在统一码中使用一样的码位。字形(Glyph)这个辞汇用于描述一个特定字符实质的外观。很多电脑字体包含许多字形,且由一个字符的统一码码位来对其字形做索引。Unicode标准(The Unicode Standard)和 通用字符集彼此定义“字符”和“抽象字符”为“用来组织、控制或表达数据的成分所组集合的成员之一”。统一码的定义则补充了一些解释用的注释,鼓励读者去区分字符、字位和字形。这个准则也区分抽象字符和“编码过的字符”,后者是指和数字编码成对,以利于电脑中的表示。
相关
- 精神医学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学精神病学目前是一门医学专科,内容是关
- 原核生物原核生物(英文:prokaryote)是通常由单一原核细胞形成的生物。相对于真核细胞,原核细胞一般没有细胞内膜、没有核膜包裹的成型细胞核,细胞内无染色体,DNA链未螺旋化,并以游离的形成
- 抗生素抗性抗生素抗药性(antibiotic resistance)是抗药性的一种形式,借此特性,一些微生物亚群体,通常是细菌种,能够在暴露于一或多种抗生素之下得以生存;对多种抗生素具抗药性的病原体被视为
- 环丙沙星环丙沙星(Ciprofloxacin)是第二代氟喹诺酮类化合广效抗生素(英语:Broad-spectrum antibiotic),可对抗多种病原菌。治疗范围包含骨骼感染、关节感染、腹部感染,以及特定几种感染性肠
- 手指手指是人或一些灵长类动物(例如猿)的手上的指头。人的手指虽然非常灵活,但也非常纤细,原因是因为活动手指的肌肉不位于手指内,而位于下臂,这些肌肉通过长的腱来指导手指的运动。有
- 基本传染数基本传染数(Basic reproduction number)是在流行病学上,指在没有外力介入,同时所有人都没有免疫力的情况下,一个感染到某种传染病的人,会把疾病传染给其他多少个人的平均数。基本
- 748Template:Congenital malformations and deformations of nervous system Template:Congenital malformations and deformations of eye Template:Congenital malformations
- 迪纳厄斯第纳里乌斯(拉丁语:denarius,复数形式: denarii),又译第纳里、第纳留斯、狄纳留斯、第纳尔斯, 在古罗马货币系统中,是从公元前211年开始铸造的小银币。它是流通中最常见的硬币,它逐
- 胃体胃是人和脊椎动物消化系统的一部分,是贮藏和消化食物的器官。胃上接食道,下接十二指肠。位置大约位于人体的左上腹,肋骨以下。胃主要将大块食物研磨成小块,将食物中的大分子降解
- 元音长度元音长度(英语:vowel length)是元音发音持续时间的长度。持续时间较普通元音发音时长的称为长元音;持续时间较短的元音称为短元音。国际音标对于长元音的标记方式,是在元音之后加
