差分编码

✍ dations ◷ 2025-08-16 08:49:48 #版本控制系统,无损压缩算法

差分编码(英语:Delta encoding),又称增量编码,是指在序列式资料之间以数据差异(英语:Data differencing)形式存储或发送资料的方式(相对于存储发送完整文件的方式)。差分编码应用广泛,如需要查看文件的历史更改记录(版本控制、git等)、Windows中的远程差分压缩(英语:Remote Differential Compression)、在线备份等场景均用到了差分编码。

差异存储在称为“delta”或“diff”的不连续文件中。由于改变通常很小(平均占全部大小的2%),差分编码能大幅减少资料的重复。一连串独特的delta文件在空间上要比未编码的相等文件有效率多了。

差分编码的简单例子是存储序列式资料之间的差异(而不是存储资料本身):不存“2, 4, 6, 9, 7”,而是存“2, 2, 2, 3, -2”。单独使用用处不大,但是在序列式数值常出现时可以帮助压缩资料。

相关

  • 生态系统的物质循环生物地质化学循环(英语:Biogeochemical Cycle,又称作生态系统的物质循环)在生态学上指的是化学元素或分子在生态系统中划分的生物群落和无机环境之间相互循环的过程。这使得相关
  • 约法三章约法三章原指刘邦攻入秦朝都城咸阳后,一度制定简化秦朝苛法的做法,后来演变成为根本性的法律规定,曾成为“宪法”的名称。约法三章一词,最早出现于《史记》“高祖本纪”。公元前
  • 埃尔斯米尔岛埃尔斯米尔岛(英语:Ellesmere Island),加拿大北极群岛中最北岛屿,世界第十大岛,面积196,235平方公里,南为巴芬岛,与东边的格陵兰岛仅隔一条狭窄的内尔斯海峡。目前属加拿大努那福特
  • 台山话台山话,又称新宁话,属粤语四邑方言片。某些语境下,台山话就是四邑话的代名词。四邑方言是粤语系统中跟广州话差异较大的一种方言之一。主要分布在中国广东省江门市(原称四邑,后因
  • 蛇蜥蛇蜥(学名:Anguis fragilis)是一种无足蜥蜴,原产自欧亚大陆。蛇蜥属于半穴居型蜥蜴,大多时间藏于物体下方。蛇蜥的皮肤很光滑,上有互不重叠的鳞片。像其他许多蜥蜴一样,蛇蜥可以自
  • 白水门事件白水事件或白水门事件(Whitewater scandal)是一件美国的著名政治丑闻,发生在比尔·克林顿的总统任期,白宫副法律顾问文森特·福斯特(Vincent Foster)去世后。1992年3月,比尔·克林
  • 朝鲜三国时代朝鲜半岛三国时代(朝鲜语:삼국시대)是朝鲜半岛427年到公元660年之间高句丽(前37年-668年)、百济(前18年-660年)、新罗(前57年-935年)三国鼎立的历史时期。三国的文化和语言相通。宗教原
  • 史密斯回声史密斯回声(Echosmith)是一个来自美国的摇滚与独立流行的乐队。于 2009 年在加州奇诺成立,由 Graham、Sydney、Noah 和 Jamie Sierota 四位兄弟姐妹组成。随着大哥Jamie在2016
  • Java版本历史Java语言自JDK1.0版本以来经历了许多次更新,也在基本程序库中增加了大量的类别和包。从J2SE 1.4开始,Java语言的变动由 Java Community Process(JCP)管理,JCP使用Java规范请求(Jav
  • 宋庆宋庆(1820年-1902年),中国清代将领。字祝三,山东蓬莱县泊子宋家村人。宋庆出身于军伍。累升至湖南提督及四川提督,手下军队号称“毅军”。早年落魄,廿四岁时投靠同乡亳州知州宫国勋