JPEG 2000

✍ dations ◷ 2024-09-20 06:05:23 #图形文件格式,影像科技,小波分析,影像压缩技术

JPEG 2000是基于小波变换的图像压缩标准,由联合图像专家小组(英语:Joint Photographic Experts Group)创建和维护。JPEG 2000通常被认为是未来取代JPEG(基于离散余弦变换)的下一代图像压缩标准。JPEG 2000文件的副档名通常为.jp2,MIME类型是image/jp2。

JPEG 2000的压缩比更高,而且不会产生原先的基于离散余弦变换的JPEG标准产生的块状模糊瑕疵。JPEG 2000同时支持有损数据压缩和无损数据压缩。另外,JPEG 2000也支持更复杂的渐进式显示和下载。

JPEG 2000是国际标准化组织(ISO)发布的标准,文档代码为ISO/IEC 15444-1:2000。虽然JPEG 2000在技术上有一定的优势,但是到目前为止(2006年),互联网上采用JPEG 2000技术制作的图像文件数量仍然很少,并且大多数的浏览器仍然不支持JPEG 2000图像文件的显示。但是,由于JPEG 2000在无损压缩下仍然能有比较好的压缩率,所以JPEG 2000在图像品质要求比较高的医学图像的分析和处理中已经有了一定程度的广泛应用。

JPEG 2000的目标不仅仅是性能要超越JPEG,而且增加和增强了如可缩放性和可编辑性这样的特性。JPEG 2000最大的特色在于,与JPEG等技术在数据编码上采取了不一样的思维,同样的数据编码可以使用多种手段解码以应付不同需求。JPEG 2000的编码内容具有可缩放性(Scaling)。其编码内容可以在任意位置截断,从头至此的编码片段可被解码回一张较低分辨率的图片。编码片段越长,解码后的分辨率越高(或说放大到相同分辨率时,其峰值信噪比(PSNR)较佳)。这意味了当需要更高压缩率时,直接丢弃后方的编码数据即可达成;或者,可以视需求只解码头一部分而得到缩图。不过这样的特征也使得编码、解码单元必须更复杂。

已经发布的JPEG 2000标准包括ISO/IEC 15444-1:2000。另外,和JPEG 2000相关的一些额外标准也正在制定和讨论中,比如JPEG 2000安全图像传输()以及基于连接的JPEG 2000图像浏览()等。

在JPEG 2000标准的几个其他部分存在;他们当中有ISO / IEC 15444-2:2000,JPEG 2000的扩展定义.jpx文件格式,具有例如网格量化,扩展的文件格式和附加的色彩空间, ISO / IEC 15444-4:2000年,参考测试和ISO / IEC 15444-6:2000,化合物的图像文件格式(.jpm),使化合物文本/图像图形压缩扩展安全图像传输,JPSEC(ISO / IEC 15444-8),为无线应用增强的纠错机制,JPWL(ISO / IEC 15444-11)和扩展体积图像编码,JP3D(ISO / IEC 15444-10 )也已经可以从ISO。

在2005年,一个JPEG 2000基于图像浏览协议,称为JPIP已出版作为ISO / IEC 15444-9。在此框架下,潜在的巨大图像的选定区域已被从图像服务器上的请求而发送一个客户端,从而减少所需的带宽。JPEG 2000的数据也可以使用ECWP和ECWPS协议ERDAS ECW / JP2的SDK中发现流。

主要文章:Motion JPEG格式2000动态JPEG 2000,(MJ2),在ISO标准的第3部分最初定义为JPEG2000(ISO / IEC 15444-3:2002,)作为一个独立的文件,现在已经表达了ISO / IEC 15444-3:2002 / AMD 2:2003在ISO基格式方面,ISO / IEC 15444-12和在ITU-T建议T.802 它指定使用的JPEG 2000格式的影像定时序列(运动序列),可能结合音频,并组合成一个整体呈现。它还定义了文件格式,基于ISO基础媒体文件格式(ISO 15444-12)。档案格式为Motion JPEG格式2000的图片档案,像是RFC 3745的.mj2和.mjp2。

它是一个开放的ISO标准和先进的更新MJPEG(或兆焦耳),这是基于传统的JPEG格式。不像普通的图片格式,如MPEG-4部分2,WMV和H.264,MJ2不采用时间或帧间压缩。相反,每个帧是由任一种有损或JPEG 2000及其物理结构的无损变体不依赖于时间顺序编码一个独立的实体,但它确实使用一个单独的配置文件,以补充数据。对于音频,它支持的LPCM编码,以及各种MPEG-4的变体,如“原始”或补充的内容

动态JPEG 2000(常引用为MJ2或MJP2)被认为是数字档案格式,由美国国会图书馆。 2013年6月,从美国国会图书馆为纽约时报杂志,关于“小贴士归档家庭史”,就像FFV1编解码采访伯特伦里昂,H264或苹果公司的ProRes被提及,但JPEG 2000是没有的。

ISO / IEC 15444-12相同与ISO / IEC 14496-12(MPEG-4第12部分),并且它定义了ISO基本媒体文件格式。例如,动态JPEG 2000文件格式,MP4文件格式或3GP文件格式也基于此的ISO基础媒体文件格式

开放地理空间联盟(OGC)定义的地理参考JPEG元数据标准2000的图像与使用地理标记语言(GML)格式嵌入的XML:在GML JPEG 2000地理编码影像(GMLJP2),1.0.0版。01-18 2.0版,题为GML在JPEG 2000(GMLJP2)编码标准第1部分:核心被批准2014-06-30。

含有GMLJP2标记JP2的JPX文件可以位于与显示在由一个合适的地理信息系统(GIS)上的地球表面上的正确位置,以类似的方式来的GeoTIFF图像。

尤其在低压缩比情形下,JPEG 2000优势尤其明显。主要因为其基于小波转换并搭配更强的熵编码:小波转换避免了离散余弦转换区块化时(如JPEG的8×8网格)造成的马赛克失真;熵编码也从JPEG的霍夫曼编码改用效能更佳的算术编码。(JPEG 2000在后续编码时仍需要区块化的动作,不过其区块通常都远比JPEG的8×8区块来的大。)

递进性(Progressive)与可适性(Scaling)在此可以算是一体的两面。JPEG 2000在编码技术上使用了不同的思维,类似于从低分辨率的资讯慢慢递进排列到高分辨率的资讯。

JPEG 2000的编码除了在大小∕品质上有递进性或可适性,在图片的空间区域上也同样有特别的安排。当使用者只想解码取用图片中特定区域时,可以依特定规律找出该区域的编码数据,而不需预先解码整张图片。

类似可适性与区域解码的综合结果,不同的区域可以挑选不同的压缩品质。通常图片中特定部分的重要性远大于其他部位,此时可利用重点区块处理达到差异化处理的效果。

JPEG 2000可以采用同一套编码方式产生失真或非失真的压缩结果。可以粗略想像为利用可缩放性直接把非失真的结果截断为失真的结果。而JPEG的失真压缩与非失真压缩作法差异较大。

JPEG 2000与JPG同样有错误容忍的特性。若传输过程中出现些许位元错误,由于在编码过程会切分许多阶层结构,可以避免该错误影响范围的扩大。

支援高动态范围成像、支援图片透明度。

在有损压缩下,JPEG 2000一个比较明显的优点就是没有JPEG压缩中的马赛克失真效果。JPEG 2000的失真主要是模糊失真。模糊失真产生的主要原因是在编码过程中高频量一定程度的衰减。传统的JPEG压缩也存在模糊失真的问题。

就图像整体压缩性能来说,目前有一些文章可能夸大JPEG 2000的性能。事实上,在低压缩比情形下(比如压缩比小于10:1),传统的JPEG图像质量有可能要比JPEG 2000要好。JPEG 2000在压缩比比较高的情形下,优势才开始明显。整体来说,和传统的JPEG相比,JPEG 2000仍然有很大的技术优势,通常压缩性能大概可以提高20%以上。一般在压缩比达到100:1的情形下,采用JPEG压缩的图像已经严重失真并开始难以识别了,但JPEG 2000的图像仍可识别。有损压缩图像质量或失真程度一般用峰值信噪比(PSNR)指标来衡量。虽然峰值信噪比不能完全反映人类视觉效果,但是它仍是一个目前比较流行的量化指标。

虽然JPEG 2000也支援无失真的编码方式,但是它并不企图完全取代今日主要的无失真影像档格式。
例如图表之类的影像,如果图档之中有许多像素是同一颜色,那么PNG(Portable Network Graphics)格式仍然会有更小的储存空间,而且有一些JPEG 2000所没有的特殊压缩功能。

JPEG 2000为了达成可适性的效果,将图片的编码分为众多层级(由大至小):图片(Image)、区块(Tile)、频块(Sub-band)、编码区段(Code-block)、位元层(Bit-plane)、分流(Pass)。依照压缩编码动作可以粗略分为:

详见离散小波变换条目。
系以阶层式的采样(down sampling)、升采样(up sampling)、相减(取差异部分)的方式来取得阶层状的频率资讯。把影像区块分为多层次的高频频块和低频频块:其中低频频块是直接采样的结果,可以视为影像的近似,反映影像的大略情形;高频频块则是剩余部分,反映了影像的高频资讯,可以理解为影像的细节。此处的滤波器选择主要有两种:Daubechies 9-tap/7-tap filter(用于失真压缩)和Le Gall 5tap/3-tap filter(用于非失真压缩)。

量化的意义在于将一组连续讯号对应到一组离散讯号,后续的离散讯号以单纯的位元表示,可达到压缩数据并数字化的条件。简言之为将频块带有小数的数据分段、近似,以较为单纯的位元表示。(从单元处理过渡到位元处理)


此技术先将数据作好适当的切割、归类后,利用搭配统计分布模型的熵编码法压缩数据。由于数据经有条理的适当分割,具备可适性的特性,在最后可以衡量所需要的数据大小与品质,找出最佳分割点。舍弃该点以后的数据,仍保有高品质的特性。以下就三者分开描述

首先对数据作适当的切割、归类,如此有两大好处:其一不同类型的数据其0、1位元的统计特性不同,分开处理可以增进压缩效率;其二为依数据重要性的不同作出区隔,从最重要到不重要作排列,以达成可适性(Scaling)的效果。在切割归类上,有以下名词作为单位:

详见算术编码条目。
算术编码是一种无损的熵编码法。算术编码把输入数据视为一种0~1之间的切割,根据内容统计模型决定这次输入数据的切割位置。当所有数据输入毕以后,可以得到一个0~1之间的小数,该小数的数值以数据形式表示(如位元)即为压缩编码后的结果。算术编码较其他的熵编码法(如哈夫曼编码)还要更接近熵编码法的数学理论极限。

由于上述压缩后的数据,具备可适性的特性,在压缩的最后可以视需求衡量最后数据大小与品质,找出最佳分割点。舍弃该点以后的数据,仍保有在该需求的衡量下,最高品质的特性。做到良好的压缩率控制。

虽然避免了8X8区块克服了块状模糊的问题,不过也同时失去了8X8区块对于运算效率帮助的部分,造成需要运算时间加长,此外8X8区块也可以帮助减少硬件的需求(需要将全影像暂存的位置),JPEG2000就不得不面对这个问题。

JPEG 2000存在版权和专利的风险。这也许是目前JPEG 2000技术没有得到广泛应用的原因之一。JPEG 2000标准本身是没有授权费用,但是,因为编码的核心部分的各种算法被大量注册专利,所以一般认为,不太可能避开这些专利费用开发出免授权费的商用编码器。

且JPEG 2000是受专利保护,但贡献的公司和组织一致认为,其第一部分 - 核心许可证编码系统,所有贡献者可以免费得到。该JPEG委员会指出:

一直以来,该委员会的JPEG其标准应该是可执行其基准形式不需支付使用费和特许费强大的目标......和未来的JPEG 2000标准已经沿着这些路线准备,并达成协议超过持有多项专利在这一领域,允许在不与支付许可费或使用费的标准连接使用其知识产权的20大机构。

然而,JPEG委员会已经承认,未申报的专利潜艇可能仍然存在危险:当然,还是有可能的,其他组织或者个人不得声称影响执行标准的知识产权,任何实施者都敦促开展自己的搜索和调查在这个区域。

相关

  • 全基因组关联分析全基因组关联分析(Genome-wide association study)是指在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs。GWAS为人们打开了一扇通往研
  • CpG岛CpG岛(CpG islands)是指DNA上一个区域,此区域含有大量相联的胞嘧啶(C)、鸟嘌呤(G),以及使两者相连的磷酸酯键(p)。哺乳类基因中的启动子上,含有约40%的CpG岛(人类约70%)。一般CpG岛的长度
  • 德国大学德国的大学包括有博士学位授予权的综合性大学(Universität)、无博士学位授予权的应用科技学院(Fachhochschule)和艺术类院校,按办学性质可分为公立、私立和教会学校。以下是德国
  • 益达胺益达胺(Imidacloprid)又名吡虫啉,是新一代类尼古丁超高效杀虫剂,纯品呈无色无味的晶体。主要破坏昆虫的神经系统功能。对昆虫具有广谱、高效、害虫不易产生抗性,对人、哺乳动物、
  • 群山机场群山机场(朝鲜语:군산공항/群山空港 Gunsan Gonghang */?,IATA代码:KUV;ICAO代码:RKJK)是一座位于大韩民国全罗北道群山市的军民两用机场,使用单位包括了大韩民国空军和驻韩美军,军
  • 美国国债美国国债指美国联邦政府欠美国国库券持有者的金额。国债是政府欠债权人的债务,不论该债权人是国民或外国人。而外债则是所有国内机构,包括公营和私营,欠外国债权人的债务。在美
  • 铜陵县义安区,原为铜陵县,位于中国安徽省铜陵市西北郊,长江沿江南岸,是铜陵市下辖的一个区。面积876平方千米,人口32万。邮政编码244100。政府驻顺安镇。唐代前期,铜陵县境原为宣城郡南
  • 高氯酰氟高氯酰氟是具有化学式ClFO3的活泼气体,具有类似于汽油和煤油的独特甜味。有毒,是一种强大的氧化剂和氟化剂。是高氯酸的酸性氟化物 。 尽管高氯酰氟的生成焓( Δf°=-5.2千卡/
  • 雷兽科雷兽(学名:Brontotheriidae,或称Titanotheriidae)是奇蹄目下一科已灭绝的哺乳动物。虽然雷兽有可能是马的近亲,但外表却很像犀牛。它们生存于5千6百万至3千4百万年前的始新世早期
  • 浊边搭嘴音浊边搭嘴音(Voiced lateral click)是一种辅音,主要出现于南非的一些口语中。表示此音的国际音标(IPA)是⟨ǁ̬⟩或⟨ᶢǁ⟩,亦有部分语言学家偏好使用已废弃的音标⟨ʖ̬⟩或⟨ᶢ