数据(英语:Data)需要解释才能成为信息。要将数据转换为信息,必须考虑几个已知因素。所涉及的因素由数据的创建者和所需信息决定。元数据用于引用有关数据的数据。元数据可以间接、指定或给定。与物理事件或过程相关的数据也将具有时间数据。在几乎所有情况下,这个时间分量是隐含的。当温度记录器等设备从温度传感器接收数据时就是这种情况。当接收到温度时,假设数据具有“现在”的时间参考。所以设备一起记录日期,时间和温度。
数字数据是使用(1)和零(0)的二进制数系统表示的数据,而不是模拟表示。在现代(1960年后)计算机系统中,所有的数据都是数字的。在大多数情况下,计算机中的数据作为并行数据移动。在大多数情况下移动到或来自计算机的数据作为串行数据移动。请参见并行通信和串行通信。来自模拟设备(例如温度传感器)的数据必须通过“模数转换器”或“ADC”(请参见模拟数字转换器)将模拟数据转换为数字数据。
表示数据的数量,字符,或在其上的操作由执行符号计算机被存储并记录在硬盘(磁、光盘或机械的记录介质),和传输在数字电信号的形式。
程序是一组数据,由一系列编码软件指令组成,用于控制计算机或其他机器的操作。物理计算机存储组件由一个地址和一个字节/字的数据存储组成。数字数据通常存储在有关联数据库中,如表或数据库,通常可以表示为 关键字/值
数据可以组织在许多不同类型的数据结构中,包括数组、图形和对象。数据结构可以存储许多不同类型的数据,包括数字,字符串甚至其他数据结构。数据通过I/O设备进出计算机。
在另一种使用方法,二进制文件(不是人类可读的)有时被称为与人类可读的“文本”不同的“数据”。2007年数字数据总量估计为2810亿千兆字节(= 281亿字节)。这数据来自三个状态:静止数据,传输中的数据和正在使用的数据。
在特殊的情况下,单个数据是存储在特定位置的值。
从根本上说,计算机遵循一系列以数据形式给出的指令。执行给定任务(或多个任务)的一组指令称为“程序”。在名义情况下,由计算机执行的程序将由二进制机器代码组成。由程序操纵但不是由CPU实际执行的存储元素也是数据。程序指令和程序操作的数据都以完全相同的方式存储。因此,计算机程序可以通过操纵其过程化数据来操作其他计算机程序。
程序和数据之间的界限会变得模糊。一个解释器,例如,是一个程序。解释器的输入数据本身就是一个程序,只是不是以本地机器语言表示的。在许多情况下,解释的程序将是一个人类可读的文本文件,它由文本编辑器程序(通常与纯文本数据相关联)进行操作。元编程类似地涉及将其他程序操作为数据的程序。如编译器,链接器,调试器,程序更新程序,病毒扫描程序等程序使用其他程序作为其数据。
要将数据字节存储在文件中,必须以“文件格式”序列化。通常,程序存储在与其他数据不同的特殊文件类型中。可执行文件包含程序;所有其他文件也是数据文件。然而,可执行文件也可能包含内置于程序中的“在线”数据。特别地,一些可执行文件具有数据段,其名义上包含常数和初始值(两个数据)。
例如:用户可能会首先指示操作系统从一个文件加载文字处理程序,然后使用文字处理程序编辑存储在另一个文件中的文档。在此示例中,该文档将被视为数据。如果字处理器还具有拼写检查器,则拼写检查器的字典(单词列表)也将被视为数据。该算法使用的拼写检查建议更正是,要么机器代码的一些解释的数据或文本编程语言。
数据中的键提供值的上下文。无论数据的结构如何,总是存在一个关键组件。数据和数据结构中的数据键对于给数据值赋予意义至关重要。没有一个直接或间接与一个值结合的关键字,或者一个结构中的值的集合,这些值就变得毫无意义,不再是数据。也就是说,必须至少有一个与值组件相关联的关键组件,以便将其视为数据。数据可以以多种方式在计算机中表示,具体如下: