有损数据压缩

✍ dations ◷ 2025-10-28 10:05:32 #数据压缩,有损压缩算法

有损数据压缩(英语:lossy compression)是一种数据压缩方法,经过此方法压缩、解压的数据会与原始数据不同但是非常接近。它是与无损数据压缩相对的压缩方法。有损数据压缩又称破坏性资料压缩、有损压缩、有损压缩、不可逆压缩。

有损数据压缩借由将次要的数据舍弃,牺牲一些质量来减少数据量、提高压缩比。这种方法经常用于压缩多媒体数据(音频、视频、图片),尤其常用于流媒体以及互联网电话领域。根据各种格式设计的不同,有损数据压缩都会有代间损失——每次压缩与解压文件都会带来渐进的质量下降。

我们可以借由无损压缩,在不失去任何信息的条件下,将资料压缩得更小。例如,当一张图片存储成数字文件时,我们会将它转换成一连串的点,再分别存储每个点的颜色信息。如果某张图片由200个红点构成,我们会以类似“红点、红点、...(重复197次)...、红点”的格式来存储它。在这个例子中,我们可以改成用“200个红点”这样的格式来存储这张图片,就能不失去任何信息的完成压缩。

然而,若要保留源文件案的所有信息,信息论说明了,无论使用任何压缩方法,文件大小都无法低于一个下界。一个直观的例子:压缩后得到的zip文件会比源文件案更小,但一直重复压缩同一个文件并不会让文件大小变成0,因为源文件案终究含有一定量的信息。

有损压缩却可以突破这个限制。在很多情况下,资料会包含比必要的还多的信息。例如,一张分辨率过高的照片,其中的细节肉眼可能已无法识别;同理,在一个音量很高的音频片段中,一些细节可能是人耳难以察觉的。舍弃这些人类无法察觉的细节,就可以用更小的资料量,提供与原始资料相差无几的感官体验。有时也允许失去一部分可以察觉的细节,来达到更好的压缩率。

有两种基本的有损压缩机制:

有些系统中同时使用这两种技术,变换编解码用于压缩预测步骤产生的误差信号。

有损方法的一个优点就是在有些情况下能够获得比任何已知无损方法小得多的文件大小,同时又能满足系统的需要。

有损方法经常用于压缩声音、图像以及视频。有损视频编解码几乎总能达到比音频或者静态图像好得多的压缩率(压缩率是压缩文件与未压缩文件的比值)。音频能够在没有察觉的质量下降情况下实现10:1的压缩比,视频能够在稍微观察质量下降的情况下实现如300:1这样非常大的压缩比。有损静态图像压缩经常如音频那样能够得到原始大小的1/10,但是质量下降更加明显,尤其是在仔细观察的时候。

当用户得到有损压缩文件的时候,譬如为了节省下载时间,解压文件与原始文件在数据位的层面上看可能会大相径庭,但是对于多数实用目的来说,人耳或者人眼并不能分辨出二者之间的区别。

一些方法将人体解剖方面的特质考虑进去,例如人眼只能看到一定频率的光线。心理声学模型描述的是声音如何能够在不降低声音感知质量的前提下实现最大的压缩。

人眼或人耳能够察觉的有损压缩带来的缺陷称为压缩有损。

上面的图像展示了用不同的有损压缩方法压缩同一幅图像得到的文件大小。这幅图像选自事实上的测试图像工业标准莲娜图。

好的有损压缩算法能够扔掉“不重要”的信息并且能够保留“关键”的信息。

从技术的角度来讲,去除文字母音字母也可以看作是有损数据压缩的一种方法,只有子音的情况下根据上下文通常也仍然可以阅读。研究人员也曾经半开玩笑地用字典中的短单词替换长单词或者使用生成文本技术(generative text techniques) 进行文本压缩,尽管这种方法有时是属于相关的(有损数据转换(英语:Lossy data conversion)领域。

相关

  • 致畸物质畸形学(英语:Teratology)是研究生理上发展缺陷的学科。人们常常认为它就是研究人类先天性障碍的,但是其实畸形学的覆盖面比这个广得多。除了先天发育之外,它也研究其他的生命阶段
  • 枯草杆菌枯草杆菌(学名:Bacillus subtilis),是芽孢杆菌属的一种细菌,为革兰氏阳性的好气性菌,普遍存在于土壤及植物体表,在人体亦可发现在肠道内共生的枯草杆菌。型态上的主要特征是菌体表
  • A13A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码A13(滋补药)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collaboratin
  • 一氧化镤一氧化镤是具放射性的无机化合物,是一种镤的氧化物,化学式为PaO,是白色不透明晶体。一氧化镤有时能再盐岩中发现。一氧化镤和其他镤氧化物不同在于一氧化镤只有2价。镤氧化时,能
  • 隆庆 (明朝)隆庆(公元1567年-1572年)是明穆宗朱载坖的年号,明朝使用隆庆这个年号一共6年。隆庆年间,明朝采取一系列新政,重振国威,史称隆庆新政。隆庆六年六月明神宗即位沿用。寓意兴隆、喜庆
  • 麟趾 (瓜尔佳氏)麟趾(满语:ᠯᡳᠨᡷᡳ,穆麟德:;?-1861年),瓜尔佳氏,字蕉园,勇号绩勇巴图鲁,谥壮介。咸丰元年,刑部八品笔帖式、理藩院员外郎上行走。咸丰三年,任理藩院员外郎。咸丰六年,任浙江金华府知府、
  • BEJ48BEJ48是一个在2016年于北京成立的中国大型女子偶像组合,为SNH48的姊妹团体,隶属于北京丝芭文化传媒有限公司。BEJ48的基本定位同样是秉承SNH48的基本定位,基于“可面对面偶像”
  • 假面骑士帝骑 全骑士对战大修卡《剧场版 假面骑士帝骑 全骑士对战大修卡》(日语:劇場版 仮面ライダーディケイド オールライダー対ダイショッカー)为日本特摄节目《假面骑士帝骑》的剧场版,2009年8月8日公映。
  • 摩登女郎谋杀案《摩登女郎谋杀案》()是布赖恩·德帕尔马编剧及导演的首部作品,1968年在纽约首映。该片很长一段时间都未再与观众见面。该片讲述一个拍色情片的男子与他的一个女模特的故事。模
  • 王锜 (明朝)王锜(1433年—1499年),字元禹,明代长洲(今苏州吴县)人。生于宣德八年(1433年),自幼好学,博览群书,尤精于史学,曾任《元史》的编修工作,一生不仕,自号苇庵处士,别号梦苏道人。弘治十二年(1499