文件格式

✍ dations ◷ 2025-06-27 06:00:06 #文件格式

文件格式(英语:file format),又称文件类型,是指电脑为了存储信息而使用的对信息的特殊编码方式,是用于识别内部储存的资料。比如有的储存图片,有的储存程序,有的储存文字信息。每一类信息,都可以一种或多种文件格式保存在电脑存储中。每一种文件格式通常会有一种或多种扩展名可以用来识别,但也可能没有扩展名。扩展名可以帮助应用程序识别的文件格式。

对于硬盘驱动器或任何电脑的存储设备来说,有效的信息只有0和1两种。所以电脑必须设计有相应的方式进行信息-比特的转换。对于不同的信息有不同的单元格式。

有些文件格式被设计用于存储特殊的数据,例如:

同一个文件格式,用不同的程序处理可能产生截然不同的结果。例如Word 文件,用Microsoft Word观看的时候,可以看到文本的内容,而以无格式方式在音乐播放软体中播放,产生的则是噪声。一种文件格式对某些软体会产生有意义的结果,对另一些软体来看,就像是毫无用途的数位垃圾。

许多文件格式都有公开的、不同程度规范或者建议的格式。这些规范或者建议描述了数据如何编码,如何排列。有时也规定了是否需要特定的计算机程序读取或处理。有两种情况下,文件格式没有公开。第一种情况是:开发者将文件格式视作商业秘密不愿公开;第二种情况是:开发者不愿或花去很少的时间用于规范文档。

需要注意的是,使用不公开的文件格式可能会带来额外的成本。要了解这类文件格式,或者需要通过对获得的文件进行逆向工程,或者通过向开发者付费来获得文件的格式。第二种方式中往往还需要与开发者签订不扩散协议。不论怎样两种方式都是费时,费钱的。

从程序的角度来看,文件是数据流,文件系统为每一种文件格式规定了访问的方法。例如:元数据。不同的操作系统都习惯性的采用各自的方式解决这个问题,每种方式都有各自的优缺点。

当然,现代的操作系统和应用程序,一般都需要这里所讲述的方法处理不同的文件,

用扩展名识别文件格式的方式最先在数字设备公司的CP/M操作系统被采用。而后又被DOS和Windows操作系统采用。扩展名是指文件名中,最后一个点(.)号后的字母序列。例如,HTML文件通过.htm.html扩展名识别;GIF图形文件用.gif扩展名识别。在早期的FAT文件系统中,扩展名限制只能是三个字符,因此尽管现在绝大多数的操作系统已不再有此限制,许多文件格式至今仍然采用三个字符作扩展名。因为没有一个正式的扩展名命名标准,所以,有些文件格式可能会采用相同的扩展名,出现这样的情况就会使操作系统错误地识别文件格式,同时也给用户造成困惑。

扩展名方式的一个特点是,更改文件扩展名会导致系统误判文件格式。例如,将filename.html简单改名为filename.txt会使系统误将HTML文件识别为纯文本格式。尽管一些熟练的用户可以利用这个特点,但普通用户很容易在改名时发生错误,而使得文件变得无法使用。因此,现代的有些操作系统管理程序,例如Windows Explorer加入了限制向用户显示文件扩展名的功能。

一种广泛应用在UNIX及其派生的操作系统上的方法是将一个特殊的数字存放在文件的特定位置里。最初这个数字一般是文件开始处的2个字节。现在一般是将任何可以独一无二字符序列都可以作为特征签名。例如GIF图形文件是将文件开始处的六个字节作为特征签名的,它可以是GIF87a或者GIF89a。但也有些文件很难通过这种方式识别,比如HTML文件。

采用这种方式可以更好的防止对文件格式发生误判,并且特征签名可以给出关于文件格式的更详细的信息。这种方式的缺点是效率较低。特别是显示大量的文件时,由于每种特征签名具有不同的识别方式,将消耗系统大量的资源对文件格式进行判断。扩展名和后面将提到的元数据方式由于采用固定格式数据,可进行快速匹配。应用程序往往利用特征签名来判断文件是否完整和有效。

最后一种方式将文件格式信息存放到磁盘特定的位置。

采用这种方式,元数据与文件本身分开存放。此法的缺点是可移植性差。因为不同的文件系统之间元数据可能需要转换。

苹果计算机的文件系统为每个文件的目录入口都存储了和。这些代码称作OSType。例如一个苹果计算机创建的文件的创建者会是AAPL而也是APPL。RISC操作系统采用类似的系统,用一个12比特位的数字索引描述表。例如:十六进制的FF5代表PoScript,文件类型就是PostScript文件。

HPFS, NTFS, FAT12, FAT16,及FAT32文件系统可以保存额外的文件属性信息。它是由名字和与名字对应的值组成。例如扩展属性“.type”用于判断文件的类型,可能是值包括“Plain Text”或“HTML document”。一个文件可以有多种属性。

ext2,ext3,ReiserFS版本3,XFS,JFS和FFS文件系统允许存储扩展的文件属性。它是由名字和与名字对应的值组成。名字应当是独一无二的。

MIME广泛地用于许多Internet有关的应用,并且正在被广泛地采用到其他的应用中。最初在RFC 1341中说明。MIME用一个/表示文件的类型。例如:text/html代表文件是HTML文件,image/gif表示GIF文件。MIME最初是用于表示电子邮件的附件的类型。

相关

  • 卢弘喆卢弘喆(朝鲜语:노홍철/盧弘喆 Ro Hong Chul;英语: Ro Hong-chul;1979年3月31日-)出生于韩国首尔,是韩国艺人及主持人。卢弘喆是韩国著名综艺节目《无限挑战》的前主持人,以“疯孩子”
  • 国家同步辐射研究中心国家同步辐射研究中心(英文:National Synchrotron Radiation Research Center;NSRRC),座落于新竹科学园区,共有两座同步加速器光源设施,分别为「台湾光源」(Taiwan Light Source;TLS
  • 顺德菜顺德菜(又称凤城菜)是粤菜之主题代表广州菜中的一种,创自明代,系指以南海菜为基础,揉番禺、新会、鹤山、中山的部分菜式及技巧变化、改良而成。有不少广东菜式都源自顺德,粤菜中有
  • 巴生谷坐标:2°40′54″N 101°39′41″E / 2.6817337°N 101.6612934°E / 2.6817337; 101.6612934巴生谷(马来语:Lembah Klang)即巴生河流域,是马来西亚境内的一片地理区域,由吉隆坡与
  • 杰基·罗宾森杰克·罗斯福·罗宾森(英语:Jack Roosevelt Robinson,1919年1月31日-1972年10月24日),昵称杰基·罗宾森(Jackie Robinson),是美国职棒大联盟现代史上第一位非裔美国人(美国黑人)球员,在1
  • 库尔曼别克·巴基耶夫库尔曼别克·巴基耶夫(柯尔克孜语:Курманбек Сали уулу Бакиев,1949年8月1日-),吉尔吉斯斯坦贾拉拉巴德州人,吉尔吉斯斯坦政治家,曾任吉尔吉斯斯坦总理、代
  • 梁爱琪梁爱琪(1977年2月17日-)中国大陆女演员,1992年参军入伍,在解放军艺术学院学习。1995年底被总政话剧团选中踏入演艺圈。
  • 朱超石朱超石(?-418年),是朱龄石之弟。东晋、南朝人。时为河东太守。历官中书侍郎,封兴平县候。官至宁朔将军。东晋义熙十三年,刘裕伐姚秦,北魏明元帝派长孙嵩率兵阻拦,朱超石率两千兵士并
  • AlphabetAlphabet公司(英语:Alphabet Inc.),中文译名为字母表,或译为字母控股,是位于美国加州的控股公司,于2015年10月2日成立,由Google公司组织分割而来,并继承了Google公司的上市公司地位以及股票代号。Google公司重整后则成为Alphabet Inc.最大的子公司。此外,Alphabet旗下拥有Calico、CapitalG、Chronicle(英语:Chronicle (company))、DeepMind、Google、Google Fiber、GV、Jigsaw、Lo
  • 1930年大西洋飓风季1930年大西洋飓风季是有纪录以来除1914年大西洋飓风季外活跃度最低的大西洋飓风季,一共只形成三个达到热带风暴强度的天气系统。三场风暴中有两场达到飓风标准,并且都成为大型飓风,即按现代萨菲尔-辛普森飓风等级标准都达到三级飓风或以上强度。第一场风暴于8月21日在中大西洋成型。一个多星期后,人称多米尼加共和国飓风的第二场风暴形成,最高风速达到每小时250公里,属四级飓风标准。全季第三场、也是最后一场风暴于10月21日消散。全季形成的风暴很少,只有第二场飓风曾经登陆。但是,这场风暴对大安的列斯群岛构成重创,并