字符

✍ dations ◷ 2024-11-05 16:33:45 #字符
在电脑和电信领域中,字符(Character)是一个信息单位。对使用字母系统或音节文字等自然语言,它大约对应为一个音位、类音位的单位或符号。简单来讲就是一个汉字、假名、韩文字……,或是一个英文、其他西方语言的字母。字符的例子有:字母、数字系统或标点符号。另外有所谓控制字符的概念,它是指:并不对应到自然语言中的某个特定符号,而是对应到语言中一些用来处理文句的概念(类似排版)。例子为打印机或其它显示设备的命令,如Enter或Tab。电脑和通信设备会在表示字符时,会使用字符编码。是指将一个字符对应为某个东西。传统上,是代表整数的比特序列,如此,则可透过网络来传输,同时亦便于存储。两个常用的例子是ASCII和用于Unicode编码的UTF-8。根据谷歌的统计,UTF-8是当前最常用于网页的编码方式。相较于大部分的字符编码把字符对应到数字或位串,摩斯密码则是使用不定长度的电子脉冲的序列来表现字符。从历史来说,“字符”这个辞汇在工业专业中被广泛用来指一个编码过的字符(通常用于程序设计语言的API)。同样地,字符集则被广泛指为那些对应到特定比特序列的抽象字符的集合。随着Unicode编码等未指定比特形式的字符编码的到来。更精确的术语获得愈来愈多的认同。对某些文件而言,区分一个字符是信息单位而非任何特定的视觉显示是很重要的。如Aleph(א)这个希伯来字母常用于数学中,表示某种无穷,但它同时又用于原本的希伯来文件中。在统一码中,尽管这两种用法有一样外形,但它们是不同的字符,而且由不同的码位来区分。相对地,如“水”这个中文表意文字,在日文文件会和中文文件中有些微不一样的外观,这会反映在不同地区的字体。但它们仍代表相同的信息,即视为一样的字符,并且在统一码中使用一样的码位。字形(Glyph)这个辞汇用于描述一个特定字符实质的外观。很多电脑字体包含许多字形,且由一个字符的统一码码位来对其字形做索引。Unicode标准(The Unicode Standard)和 通用字符集彼此定义“字符”和“抽象字符”为“用来组织、控制或表达数据的成分所组集合的成员之一”。统一码的定义则补充了一些解释用的注释,鼓励读者去区分字符、字位和字形。这个准则也区分抽象字符和“编码过的字符”,后者是指和数字编码成对,以利于电脑中的表示。

相关

  • 头部头在解剖学上是指动物的吻端部分,通常包括脑、眼、耳、鼻、口等器官(所有这些器官都支撑着各种感官功能,如视觉、听觉、嗅觉、味觉)。有些非常低等的动物可能没有头部,但多数两侧
  • 黄体素孕酮(英语:progesterone,亦被称为黄体酮、孕甾酮、黄体甾酮、助孕激素、助孕素、黄体素或助孕酮,其缩写为P4,也被称为(孕甾-4-烯-3,20-二酮),是一种内源性类固醇和孕激素性激素,也
  • 放射性放射性或辐射性是指某元素的放射性同位素从不稳定的原子核自发地放出射线(如α射线、β射线、γ射线等)而衰变形成另一种同位素(衰变产物),这种现象称为放射性。衰变时放出的能量
  • 高雄荣民总医院坐标:22°40′46″N 120°19′25″E / 22.67942°N 120.32368°E / 22.67942; 120.32368高雄荣民总医院,简称高雄荣总(英语:Kaohsiung Veterans General Hospital),位于中华民国高
  • 领土变迁美国领土变迁(英语:Territorial evolution of the United States)列出美国领土内外边界的变更,以及地位和名称的变化。领土地图上也包括最终成为美国一部分的周边地区。并附有地
  • 陆军美国陆军(英语:United States Army),是美军的分支,美国联邦八个制服部队之一。美国陆军的前身是大陆军,组建于1775年6月14日,参与独立战争。战争结束后,大陆会议在1784年6月3日成立
  • 酸酐酸酐是具有两个酰基键合于同一氧原子上的有机化合物。 称为“酐”的原因因为它是由两个羧酸脱水而成。若两侧酰基由同种羧酸衍生而来则称为对称酸酐,分子式可表达为:(RC(O))2O
  • 方阵 (军事)方阵(英语:phalanx),是一种长方形的大规模军事阵法,通常完全由重步兵手持矛、长柄枪、萨里沙长矛或类似的武器所构成。该词特别用来描述古希腊战争中所使用的这种阵法,虽然古希腊
  • 细菌性肠胃炎肠胃炎是以胃和小肠炎症为特征的胃肠道病症,可导致腹泻、呕吐、腹部的疼痛和绞痛合并而成疾病表现。虽然与流感并无关系,但该病也被称为肠胃型感冒和消化道流感。肠胃炎通常是
  • 肺sub金/sub肺为五脏之一;根据经络、脏象学说,肺的功能是: