首页 >
字符
✍ dations ◷ 2025-11-19 09:55:57 #字符
在电脑和电信领域中,字符(Character)是一个信息单位。对使用字母系统或音节文字等自然语言,它大约对应为一个音位、类音位的单位或符号。简单来讲就是一个汉字、假名、韩文字……,或是一个英文、其他西方语言的字母。字符的例子有:字母、数字系统或标点符号。另外有所谓控制字符的概念,它是指:并不对应到自然语言中的某个特定符号,而是对应到语言中一些用来处理文句的概念(类似排版)。例子为打印机或其它显示设备的命令,如Enter或Tab。电脑和通信设备会在表示字符时,会使用字符编码。是指将一个字符对应为某个东西。传统上,是代表整数的比特序列,如此,则可透过网络来传输,同时亦便于存储。两个常用的例子是ASCII和用于Unicode编码的UTF-8。根据谷歌的统计,UTF-8是当前最常用于网页的编码方式。相较于大部分的字符编码把字符对应到数字或位串,摩斯密码则是使用不定长度的电子脉冲的序列来表现字符。从历史来说,“字符”这个辞汇在工业专业中被广泛用来指一个编码过的字符(通常用于程序设计语言的API)。同样地,字符集则被广泛指为那些对应到特定比特序列的抽象字符的集合。随着Unicode编码等未指定比特形式的字符编码的到来。更精确的术语获得愈来愈多的认同。对某些文件而言,区分一个字符是信息单位而非任何特定的视觉显示是很重要的。如Aleph(א)这个希伯来字母常用于数学中,表示某种无穷,但它同时又用于原本的希伯来文件中。在统一码中,尽管这两种用法有一样外形,但它们是不同的字符,而且由不同的码位来区分。相对地,如“水”这个中文表意文字,在日文文件会和中文文件中有些微不一样的外观,这会反映在不同地区的字体。但它们仍代表相同的信息,即视为一样的字符,并且在统一码中使用一样的码位。字形(Glyph)这个辞汇用于描述一个特定字符实质的外观。很多电脑字体包含许多字形,且由一个字符的统一码码位来对其字形做索引。Unicode标准(The Unicode Standard)和 通用字符集彼此定义“字符”和“抽象字符”为“用来组织、控制或表达数据的成分所组集合的成员之一”。统一码的定义则补充了一些解释用的注释,鼓励读者去区分字符、字位和字形。这个准则也区分抽象字符和“编码过的字符”,后者是指和数字编码成对,以利于电脑中的表示。
相关
- Clsup-/sup氯化物在无机化学领域里是指带负电的氯离子和其它元素带正电的阳离子结合而形成的盐类化合物。最常见的氯化物比如氯化钠(俗称食盐)。常见的氯化物列在右表。但有时金属(如金)溶
- 西班牙语西班牙语是美国继英语之后第二大广泛使用的语言。在美国,西班牙语使用者的人数比汉语、法语、意大利语、夏威夷语以及美洲原住民语言的使用人数的总和还要多。根据2009年由美
- 蓖麻毒蛋白结构 / ECOD结构 / ECOD蓖麻毒蛋白(英语:Ricin)是从蓖麻籽中所萃取出来的一种毒性蛋白质,几乎对所有的真核细胞都具有杀伤作用。蓖麻毒蛋白的纯品是一种白色粉末或结晶体,无味,可
- Adderall阿得拉尔或阿得拉(英语:Adderall、Adderall XR、Mydayis)是一种复方药(英语:combination drug),包含中枢神经系统兴奋剂苯丙胺的两种对映异构体的四种盐类。阿得拉尔主要用于治疗注
- 悬浊液在化学中,悬浊液(英语:Suspension)也称为“悬浮液”或“悬胶”,是指含有大到可以沉降的固体颗粒的非均相流体。在药剂学中混悬剂是指难溶性固体药物以微粒状态分散于分散介质中形
- 真皮真皮层(拉丁语、德语、英语、西班牙语: Dermis、法语、葡萄牙语: Derme)是位于表皮与皮下组织之间的一层皮肤,其由两层组成——乳头层与网状层。真皮的结构组成是胶原蛋白、弹
- 多多纳多多纳(多立克希腊语Δωδώνα, 爱奥尼亚希腊语:Δωδώνη, Dòdònè)是位于希腊西北部伊庇鲁斯的一个神谕处。虽然多多纳最早的铭文历史只能追溯至约公元前550-560年,但
- 语言类型学语言类型学(linguistic typology),语言学的分支学科,研究不同语言的特征并通过这些特征而对其进行分类。其理念是相信只有经过跨语言的比较研究才能了解人类语言的本质,并不相信
- 感叹词感叹词是用于表达各种感情的词。它与后面句子的其余成分无语法联系。现代汉语的感叹词有“啊”、“哎呀”、“天呀”等。例:古代汉语中常见的感叹词有“呜呼”、“嗟夫”、“
- 祈使句祈使语气(英语:imperative mood)是表达直接命令或请求的语气。它还用来表示禁止、请求或任何其他类的劝告。英语的祈使语气是简单地使用动词不定式来形成的。be 是其非限定形式
