次频带编码

✍ dations ◷ 2025-07-06 10:30:08 #数据压缩,音讯工程,信号处理

在信号处理中,次频带编码(sub-band coding)是一种转换编码。其作法是把信号分成许多频带后独立编码,通常是将资料做压缩的第一步,可应用于声音、多媒体、影像信号的压缩。

次频带编码在声音频号上利用听觉遮蔽(auditory masking)且符合人耳的听觉系统。一般而言,人耳可听到一定频率范围的声音,若在某特定频率的信号强度很大时,人耳对于该特定频率附近的频率辨别率几乎为0,我们称强度很大的信号遮蔽弱的信号。次频带编码的基本概念即是舍去那些被遮蔽的频带,这部分为“有损编码”,与原本的信号不同,但其舍去的信号经过分析后,仍可以不被人耳所辨别。

最常用于数字化编码的方法是脉冲编码调变(pulse-code modulation),这种方法也适用于CD和录音带。数字化转换将原本的连续信号取样后,并用最接近的整数bits表示,及量子化(quantization),但这样的方法会产生取舍误差(rounding error),并在取样域产生截断误差(truncation error)。

为了减少误差,必须要增加每个代表取样的比特数,如此一来便造成过大的比特率(像是CD audio的频道就超过700 kbits/s)。实际上,用过的比特表示并没有考虑人耳的听觉系统的敏感度。其改善的方法是用非线性脉冲编码调变,如µ-law编码,适用听觉感知曲线,其截断误差是与信号能量大小做调变。

其中Sun微系统(Sun Microsystems)的Au file format是广为人知的µ-law编码方式,使用8位µ-law编码可使CD audio的频道减低至350 kbits/s,但效果与原本相比,较为逊色。

次频带编码应用的另一个例子是G.722(第一个用于16KHz采样率的宽带语音编码算法),它利用次频带可适性差分脉冲编码调变(sub-band adaptive differential pulse code modulation, SB-ADPCM),比特率在64 kbits/s。SB-ADPCM将频带切成两次频带,每个次频带再分别用ADPCM。

介绍影像之前,先以一个一维信号为例,如图一所示

图一中,上图表示两频带的的子带编码及解码,输入信号 x ( n ) {\displaystyle {\mathit {x(n)}}} ,分别经过两个分析滤波器(analysis filter) h 0 ( n ) {\displaystyle {\mathit {h_{0}(n)}}} h 1 ( n ) {\displaystyle {\mathit {h_{1}(n)}}} 。它们个别的频率响应如下图 H 0 ( n ) {\displaystyle {\mathit {H_{0}(n)}}} H 1 ( n ) {\displaystyle {\mathit {H_{1}(n)}}} 。其中 h 0 ( n ) {\displaystyle {\mathit {h_{0}(n)}}} 为低通滤波器,所得到的 y 0 ( n ) {\displaystyle {\mathit {y_{0}(n)}}} 是信号的低频部分,其输出为原信号大略的特征(approximation); h 1 ( n ) {\displaystyle {\mathit {h_{1}(n)}}} 为高通滤波器,输出所得到的 y 1 ( n ) {\displaystyle {\mathit {y_{1}(n)}}} 是信号的细节(detail)。经过降取样(downsampling)来达到压缩的效果。而图一上图的右半部 g 0 ( n ) {\displaystyle {\mathit {g_{0}(n)}}} g 1 ( n ) {\displaystyle {\mathit {g_{1}(n)}}} 分别是合成滤波器(synthesis filter),先将 y 0 ( n ) {\displaystyle {\mathit {y_{0}(n)}}} y 1 ( n ) {\displaystyle {\mathit {y_{1}(n)}}} ,升采样(upsampling)后还原原本的信号。

接着介绍二维子带编码,如图二所示,二为信号 x ( m , n ) {\displaystyle {\mathit {x(m,n)}}} 分经过低通、高通滤波器后对横列降取样,此时会得到两张长度约为原本二分之一的图。再分别对这两张图个别经过低通、高通滤波器后对行方向降取样,可得到四张图。如图三所示


图三从左至右、上至下分别对应到图二的 a ( m , n ) {\displaystyle {\mathit {a(m,n)}}} ,代表粗略次频带(approximation subband)、 d H ( m , n ) {\displaystyle {\mathit {d^{H}(m,n)}}} ,表示水平的细节、 d V ( m , n ) {\displaystyle {\mathit {d^{V}(m,n)}}} ,表示垂直方向的细节、 d D ( m , n ) {\displaystyle {\mathit {d^{D}(m,n)}}} ,表示对角线方向的细节,即是角落(corner)的部分。若针对粗略子带继续经过更多次的低通、高通滤波器,便达到压缩的效果,最广泛的应用就是JPEG2000,其主要的算法小波转换的基本概念即是上面所述。

相关

  • 人文地理学人文地理学(英语:Human geography),是一类社会科学分支,关于研究世界、人类社会、文化、经济与环境的相互作用,强调空间和地区的关系。作为一门学科,地理分为自然地理和人文地理,后
  • 钇铁石榴石钇铁石榴石 (英语:Yttrium iron garnet或YIG) 是一种合成石榴石, 化学成分为 Y3Fe2(FeO4)3或Y3Fe5O12。它是一种亚铁磁性材料 ,居里点为560 K,YIG也可称为钇铁氧体石榴石,或称为铁
  • 桂平沉船事件桂平沉船事件发生于2012年3月11日13时25分许,广西壮族自治区贵港市所辖的桂平市“桂平石咀客渡035号”船(核载30人,实载50人)从桂平城区下航至浔江的羊栏滩白沙尾处(出事地点宽60
  • 陈肇隆陈肇隆(英语:Chen, Chao-Long;1950年9月29日-),台湾外科医师、医学家,高雄医学院医学士,担任高雄长庚纪念医院院长近13年,现转任名誉院长专注医疗服务、教学与研究。以肝脏移植(英语:Li
  • 中国印刷集团公司中国印刷集团公司(简称中印集团)是中国出版印刷领域的一家大型国有企业,由国务院国有资产监督管理委员会担任出资人进行管理,2003年2月成立,旗下有多家子公司。其前身是中国印刷
  • INFOCOMP计算机科学期刊INFOCOMP计算机科学期刊为一份国际性的科学期刊(索引指针、印刷出版、季刊、连续流通)。所注重的领域为(但不限于此): INFOCOMP计算机科学期刊是由位在巴西米纳斯吉拉斯之拉弗哈
  • 所罗门·贝雷瓦所罗门·贝雷瓦(英语:Solomon Berewa,1938年8月6日-2020年3月5日),塞拉利昂政治人物,前副总统(2002年-2007年)。1938年生于博城区。毕业于纽卡斯尔大学。1996年在艾哈迈德·泰詹·卡巴
  • 段续段续,字绍先,号东川,山西阳曲县人,陕西兰州(今甘肃省兰州市)军籍,明朝政治人物。嘉靖二年(1523年)进士,授云南道御史,次年“大礼议”中,因弹劾席书、桂萼,触怒世宗,因此入狱。贬河南郾城县
  • 乌帽子亲乌帽子亲是日本人在元服仪式上为被元服者戴冠的人。根据日本中世时代武家社会的惯例,男子成年时行元服礼时,应请一位特定人物充当“假亲”(义父),为他戴上乌帽子。这位假亲被称
  • 三娘子三娘子(蒙古语:.mw-parser-output .font-mong{font-family:"Menk Hawang Tig","Menk Qagan Tig","Menk Garqag Tig","Menk Har_a Tig","Menk Scnin Tig","Oyun Gurban Ulus Ti