资料压缩比

✍ dations ◷ 2025-11-19 15:41:04 #计算机科学

资料压缩比,或简称作压缩比,是计算机科学与信息论中用来评断资料压缩算法好坏的指标之一。通常可借由资料压缩比得知资料被压缩的程度,进而判断缩压算法的优劣。

资料压缩比的定义如下:

资料压缩比 = B 0 B 1 {\displaystyle ={\frac {B_{0}}{B_{1}}}}

B 0 {\displaystyle B_{0}} 为资料压缩前的位元数(资料量大小), B 1 {\displaystyle B_{1}} 为资料压缩后的位元数。

此外,也有人定义节省空间比率:

节省空间率 = 1 B 1 B 0 {\displaystyle =1-{\frac {B_{1}}{B_{0}}}}

举例而言,假设一张灰阶图片每个画素均用16位元表示(16 bit/pixel or 16 bpp),而压缩后的图片每个画素均用4位元表示,则资料压缩比为16/4 = 4,换言之,此压缩算法减少了1-(4/16) = 75%的资料量。

一般而言,任何资料压缩算法,无论是有损压缩算法或是无损压缩算法,其资料压缩比理论上必大于1。因为资料压缩后的位元数理论上应小于资料压缩前的位元数,不然就没有达到减少资料量的效果了。资料压缩比越大代表着资料被压缩的越小。

然而,当资料压缩比越大时并不代表资料压缩算法越好,因为资料压缩比可借由牺牲重建资料的品质来提升。所以资料压缩比大的算法可能意味着重建资讯会有很严重的失真情形。

要评估资料压缩算法的好坏,需同时考虑资料压缩比、重建资料品质与算法计算复杂度...等等。

无损压缩是资料压缩算法的其中一个类别,无损压缩指的是资料在进行压缩时不会受损,在解压缩后仍可回到原样,它的好处是能将档案还原回原貌,不会有失真的情形发生。但相对的,无损压缩能获得的资料压缩比会比较小。

有损压缩,或称为破坏性资料压缩,也是资料压缩算法的其中一个类别,它指的是资料在进行压缩时会受损,以至解压缩后的资料无法还原回原貌,会有失真的情形。它的道理简单来说就是牺牲掉一些讯息以换取更小的资料量。与无损压缩相比,有损压缩算法的优点是能有较大资料压缩比,但缺点是解压缩后的资料会有失真的情形。常见的有损资料压缩有JPEG、MP3......等等。

相关

  • 起始密码子起始密码子(英语:Start Codon)是指定信使RNA(mRNA)上开始合成蛋白质的密码子,也是第一个被核糖体翻译的mRNA上的密码子。起始密码子位于编码区内,紧邻5′非翻译区(原核生物的核糖体
  • 汉谟拉比法典《汉谟拉比法典》是古巴比伦第六代国王汉谟拉比颁布的一部法律,被认为是世界上最早的一部比较具有系统的法典,约公元前1754年(中年表(英语:middle chronology))颁布。1901年在埃兰
  • 贾科莫·莱奥帕尔迪贾科莫·莱奥帕尔迪(意大利语:Giacomo Taldegardo Francesco di Sales Saverio Pietro Leopardi,1798年6月29日-1837年6月14日),意大利诗人,散文家,哲学家,语言学家。他是意大利浪漫
  • 五通五通可以指:
  • 森林生态森林生态学(英语:Forest ecology)是指以森林生态系为研究对象的一门学科,研究者将森林视为一个生物群落,其中包含天然林地内的所有生物(英语:Biotic component)(如植物、动物、微生物
  • 西伯利亚鞑靼语西伯利亚鞑靼语是一种突厥语族的语言,为西伯利亚鞑靼人的母语,分布在俄罗斯西伯利亚西南部的鄂木斯克州、秋明州、新西伯利亚州、托木斯克州、科麦罗沃州、斯维尔德洛夫斯克州
  • 比较基因组杂交比较基因组杂交(英语:Comparative genomic hybridization,CGH)是一种分子细胞遗传学方法,在不培养细胞的情况下,分析相对于参照样品,测试样品的DNA中拷贝数变异(英语:Copy-number var
  • 台19线台19线 彰化-台南,别称中央公路,是连络台湾中南部次要城镇的纵贯省道,全线贯通彰化平原、嘉南平原。北起彰化县彰化市,南至台南市永康区,起终点皆位于台1线,总长140.195公里。路廊
  • 2,3-二氢呋喃2,3-二氢呋喃(英语:2,3-Dihydrofuran)是一种杂环化合物。是最简单的烯醇醚之一。
  • 豪杰超级解霸豪杰超级解霸为北京世纪豪杰计算机技术有限公司推出的一款支持Windows平台的影音媒体播放器,2000年左右在中国大陆的视频播放领域具有领导性地位。2005~2007年左右,豪杰公司将