采样定理

✍ dations ◷ 2024-12-23 09:42:51 #数字信号处理,信息论,数学定理

采样定理是数字信号处理领域的重要定理。定理内容是连续信号(通常称作“模拟信号”)与离散信号(通常称作“数字信号”)之间的一个基本桥梁。它确定了信号带宽的上限,或能捕获连续信号的所有信息的离散采样信号所允许的采样频率的下限。

严格地说,定理仅适用于具有傅里叶变换的一类数学函数,即频率在有限区域以外为零(参照图1)。离散时间傅里叶变换(泊松求和公式的一种形式)提供了实际信号的解析延拓,但只能近似该条件。直观上我们希望,当把连续函数化为采样值(叫做“样本”)的离散序列并插值到连续函数中,结果的保真度取决于原始采样的密度(或采样率)。采样定理介绍了对带宽限制的函数类型来说保真度足够完整的采样率的概念;在采样过程中"信息"实际没有损失。定理用函数的带宽来表示采样率。定理也导出了一个数学上理想的原连续信号的重构公式。

该定理没有排除一些并不满足采样率准则的特殊情况下完整重构的可能性。(参见下文非基带信号采样,以及压缩感知。)

奈奎斯特–香农采样定理的名字是为了纪念哈里·奈奎斯特和克劳德·香农。该定理也被埃德蒙·泰勒·惠特克(英语:E. T. Whittaker)、弗拉基米尔·科捷利尼科夫(英语:Vladimir Kotelnikov)等人独立发现。所以它还叫做奈奎斯特–香农–科特尔尼科夫定理、惠特克–香农–科特尔尼科夫定理、惠特克–奈奎斯特–科特尔尼科夫–香农定理及插值基本定理。

采样是将一个信号(例如时间或空间上连续的函数)转换为数字序列(时间或空间上离散的函数)的过程。这个定理的香农版本陈述为:

如果周期函数 x(t) 不包含高于 cps(次/秒)的频率,那么,一系列小于 1/(2) 秒的x(t)函数值将会受到前一个周期的x(t)函数值影响。

因此 2 样本/秒或更高的采样频率将能使函数不受干扰。相对的,对于一个给定的采样频率 s,完全重构的频带限制为 ≤ s/2。

在频带限制过高(或根本没有频带限制)的情形下,重构表现出的缺陷称为混叠。现在对于此定义的陈述有时会很小心的指出()必须不包括频率恰好为的正弦曲线,或是必须小于½的采样率。这二个门槛,2及s/2会称为奈奎斯特速率(英语:Nyquist rate)及奈奎斯特频率。这些是()及采样设备的属性。上述的不等式会称为奈奎斯特准则,有时会称为拉贝准则(Raabe condition)。此定理也可以用在其他定义域(例如离散系统)的函数下,唯一的不同是量测, s和的单位。

符号  = 1/s 常用来表示二次采样之间的时间间隔,称为采样周期或是采样区间。函数()的采样常用 = ()表示(较早期的文献会用),其中为正整数。在数学上理想的采样还原(插值)和Sinc函数有关,每次的采样都用中心点在采样时间,幅度是采样值的Sinc函数代替。最后将Sinc函数加总,得到连续的函数。数学上等效的方式是将Sinc函数和一连串的狄拉克δ函数卷积,再依采样到的值来加权。不过这些方式在数学上都是不实际的。不过有些有限长度的函数可以近似Sinc函数,这种因为近似的不完美造成的误差称为插值误差(interpolation error)。

实际的数字模拟转换器既不会产生加权而有延迟的Sinc函数,也不会产生理想的狄拉克δ函数,若是其模拟重建是用零阶保持,其输出的是由不同幅度及有延迟的矩形函数组成的阶跃函数,一般后面会有抗镜像滤波器(anti-imaging filter)来清除假的高频成分。

如果不能满足上述采样条件,采样后信号的频率就会重叠,即高于采样频率一半的频率成分将被重建成低于采样频率一半的信号。这种频谱的重叠导致的有损称为混叠,而重建出来的信号称为原信号的混叠替身,因为这两个信号有同样的样本值。

若()为一函数,其傅里叶变换()为:

泊松求和公式指出()的采样()已以产生()的周期和(英语:periodic summation),结果为:

X s ( f )   = d e f k = X ( f k f s ) = n = T x ( n T )   e i 2 π n T f , {\displaystyle X_{s}(f)\ {\stackrel {\mathrm {def} }{=}}\sum _{k=-\infty }^{\infty }X\left(f-kf_{s}\right)=\sum _{n=-\infty }^{\infty }T\cdot x(nT)\ e^{-i2\pi nTf},} •()。此函数也称为数列•()的离散时间傅里叶变换 (DTFT),n为整数。

如图4所示,() 的拷贝被平移了 的倍数,并相加合并。对于一个带限函数(对所有 || ≥ ,() = ),在 足够大的时候,这些拷贝之间仍然分得清楚。但如果奈奎斯特准则并不满足,相邻部分就会重叠,一般就不能明确辨别出 ()。任何超过 /2 的频率分量都会与较低的频率分量难以区分,称作与其中一个拷贝发生“混叠”。在这种情况下,通常的插值法就会产生混叠,而不是原始的分量了。

以下两种措施可避免混叠的发生:

当采样率预先由其他因素(如行业标准)确定的时候,() 通常要先滤波以将高频分量减少到可以接受的水平,再进行采样。所需的滤波器的种类为低通滤波器,而在这种应用中叫做抗混叠滤波器。抗混叠滤波器可限制信号的带宽,使之满足采样定理的条件。这在理论上是可行的,但是在实际情况中不可能做到。因为滤波器不可能完全滤除奈奎斯特频率之上的信号,所以,采样定理要求的带宽之外总有一些“小的”能量。不过抗混叠滤波器可使这些能量足够小,以至可忽略不计。

从图5中可以看到,若()的复本(也称为镜像)之间没有和 = 0的项重叠,可以由()用以下的乘积来还原:

此时证明了采样定理,因此()可以确定(),而且只有唯一解。

剩下的就只有推导重构的公式。()不需在的区域有准确的定义,因为s()在此区域为零。不过最坏的情形是 = /2,奈奎斯特频率。一个在此情形及其他较轻微的条件下都适用的函数为:

其中rect(•)为矩形函数,因此:

等式二侧反变换,可以得到惠特克-香农插值公式(英语:Whittaker–Shannon interpolation formula)

上式就是用采样值()来重构()的方式。

泊松证明了Eq.1中的傅里叶级数会产生 () 的周期求和,不管 和 是什么值。然而香农只推导了 = 情形下级数的系数。 几乎引用了香农原始的论文:

香农对于此定理的证明已经完成了,不过香农进一步探讨用Sinc函数重构原函数,也就是今日的惠特克–香农内插公式(英语:Whittaker–Shannon interpolation formula),他没有推导或是证明sinc函数的性质,但这些对于当时阅读其作品的工程师不会觉得陌生,因为当时已经知道矩形函数和Sinc函数的傅里叶对关系。

和其他证明类似,此处假设原函数的傅里叶变换存在,因此证明中没有说明采样定理是否可以延伸到有限带宽的固定随机过程。

采样定理常表示为单一变量的函数,因此定理可以直接应用到和时间相关的一维信号。不过采样定理可以直接延伸到任意数量变量的函数。例如像灰阶影像常表示为二维的实数数组(或是矩阵),其中的实数表示在对应行及列的采样位置下,像素的相对强度。因此图案会需要二个独立的变量来表示其位置,一个表示对应的行,一个表示对应的列。

彩色影像一般会包括三个独立的灰阶值,分别表示红色、绿色及蓝色等三原色(三原色光模式,简称RGB)的强度。其他用三个元素的向量表示一个点的颜色空间有HSL和HSV色彩空间、CIELAB及XYZ等。而像CMYK则是用浅蓝色、紫红色、黄色及黑色的强度来表示。这些色彩空间都是二维空间上的向量值函数。

和一维离散信号的情形类似,若图形的采样分辨率(或是像素密度)不适当,可能会有混叠的情形。例如密条纹衬衫若是用的数值若是用数字相机的图像传感器采样时,可能会造成混叠,这种二维的混叠会形成莫列波纹,改善方式是提高空间的采样率,例如拍照时更靠近衬衫,用高清晰度的传感器,或是在采样前先进行光学模糊处理。

另一个例子是右边的方格条纹,上方的图是不满足采样定理下的信号。下方则是先经过低通滤波器再降采样,得到一个较小,但没有莫列波纹。上图则是直接降采样,没有先经过低通处理后的图。

采样定理在影像上的应用需小心的进行。例如相机中标准影像传感器(CCD或CMOS)的采样程序和理想的采样程序有相当的差距,理想的采样程序会在一个点量测其影像强度,但影像传感器中为了获得足够的光量,其感测影像的区域较。换句话说,传感器是一个有限宽度的点扩散函数。一般而言这类传感器采样到的模拟光学信息不是有限带宽的,而不理想的采样本身即为低通滤波器,不过不一定可以移除会造成混叠的高频噪声。若采样区域(传感器大小)没有大到可以有反锯齿效果时,一般会需要独立的反锯齿滤镜(光学低通滤镜)来使影像模糊。虽然影像有这些和采样定理有关的问题,不过采样定理可以描述提升采样及减采样的基础。

为了描述 > 2的必要性,考虑右图(图8)中的一组弦波,公式如下,但θ值各有不同:

其中 = 2或是可以写为 = 1/(2),采样值为:

和θ值无关。上述的歧义是采样定理中使用严格的不等式,不允许等式的原因。

香农曾提到:

若频带的最小值不是零,而是由其他较大的值,也可以产生类似的结果,可以用线性变换(对应物理上的单边带调制)到最小值为零的频带来证明。此例中基本脉冲是单边带调制下的sin()/。

因此这是一个针对没有基带成分信号(其频带有一部分的信号非零,但此宽度又和最大频率无关)进行采样的充份条件。

带通条件为() = 0,针对在所有在开区域范围以外的非负:

针对某非负整数。此公式包括一般的基带条件,=0。

对应的内插函数为理想Sinc带通滤波器的冲激响应,(而不是之前用的理想Sinc低通滤波器),会切掉频带的上方及下方,这也是一组低通滤波器冲激响应的差:

其他的推广,例如信号在数个不连续的频带,也是可行的。甚至是最广义的采样定理也不一定有一个可能正确的反例。也就是说无法确定是否只要不满足采样定理,就一定会有信号的丧失。不过以工程的角度来看,比较保守的作法是假设若不满足采样定理,就很可能会有信号的丧失。

香农的采样定理可以延伸到非均匀采样,也就是采样的时间间隔非一定值。非均匀采样的采样定理指出针对band-limited的信号,只要平均采样频率满足奈奎斯特条件,就可以从采样信号完整重建原始信号。因此虽然均匀采样在信号重建的算法上比较简单,但这不是完整重建的必要条件。

非基带及非均匀采样的泛用理论是在1967年由亨利·蓝道提出。简单的说,蓝道证明了平均采样率至少需要是信号占据带宽的二倍,但前提是已知信号的频谱及其占据的带宽。在1990年代末期,此研究已延伸到信号占据带宽的数量已知,但实际在频谱上位置未知的情形。在2000年代已利用压缩感知发展了一个完整的理论。此理论用信号处理的语言写成,在2009年的论文中发表。论文中证明,若频率的位置未知,则采样率需至少为奈奎斯特准则的二倍。换句话说,因为不知道光学频谱的位置,需要将采样率乘二为代价。注意此最小采样率的要求不一定保证其数值稳定性。

当一个信号被欠采样(英语:Undersampling)时,必须满足采样定理以避免混叠。为了满足采样定理的要求,信号在进行减采样操作前,必须通过一个具有适当截止频率的低通滤波器。这个用于避免混叠的低通滤波器,称为抗混叠滤波器。

奈奎斯特–香农采样定理是对于带限函数采样及重建的充分条件。若是用惠特克–香农内插公式(英语:Whittaker–Shannon interpolation formula)重建原信号,奈奎斯特准则也是避免混叠的必要条件,因为若采样速率小于信号频带限制的二倍,可能有些信号无法正确重建。不过若信号有其他的限制,则奈奎斯特准则就不是混叠的必要条件了。

像近来在进行研究的压缩感知就是一个利用对信号额外假设来进行压缩的例子,压缩感知可以用奈奎斯特速率要慢的速率采样,然后可以完整的重建原信号。这特别用在信号在一些层面较稀疏(或可压缩)的情形。像压缩感知可以处理有效带宽(EB))很低,但不确定其频率分布位置的信号(此时采样定理就不适用了)。换句话说,其频谱较稀疏。若用采样定理,最小的采样速率是2,若是用压缩感知,采样速率若略低于2EB,仍可以完整的重建。不过此作法的重建已不再是用公式处理,而是要求解凸优化,需要有良好研究,而可能是非线性的方式处理。

哈里·奈奎斯特1928年的论文《Certain topics in telegraph transmission theory》中就已隐含了采样定理,他证明了一个带宽为的系统可以发送最多2个独立的脉冲,不过他没有直接处理连续信号采样及重建的问题。同一时期的卡尔·库普夫米勒(英语:Karl Küpfmüller)证明了类似的结果,也讨论到频带限制滤波器的sinc函数冲激响应,以及其积分,步阶响应的三角积分,频带限制滤波器及信号重建滤波器是采样定理的核心,因此在一些地区会将这二个滤波器称为Küpfmüller filter。

采样定理是在香农在1949年《Communication in the presence of noise》中提出。之前相关的研究有V. A. Kotelnikov(英语:弗拉基米爾·科捷利尼科夫)在1933年《在电缆及"以太"中电子通信的传输能力》(翻译自俄文),以及数学家埃德蒙·泰勒·惠特克(英语:E. T. Whittaker)在1915年的《Expansions of the Interpolation-Theory》(Theorie der Kardinalfunktionen)、J. M. Whittaker在1935年的《Interpolatory function theory》以及丹尼斯·加博尔1946年提出的《Theory of communication》。1999年时爱德华莱茵基金会(英语:Eduard Rhein Foundation)给予科捷利尼科夫基础研究奖,原因是“第一位提出理论正确的采样定理”。

相关

  • 无麸质饮食无麸质饮食(英语:Gluten-free diet,缩写GFD)是指没有麸质的饮食方式。麸质是一种在小麦、大麦及裸麦中含有的蛋白质成分,这些物类及其杂交种(如斯佩耳特小麦、卡姆麦(英语:Khorasan
  • 道格拉斯DC-10麦克唐纳-道格拉斯DC-10是麦克唐纳-道格拉斯公司应美国航空要求而研制的飞机,原为双引擎客机,后为确保可在短跑道上起飞及因应美国航空的要求而加上第三引擎。DC-10于1988年交
  • 重舌重舌(英语:sublingual swelling),是一个中医名称疾病,主要是以舌下肿胀疼痛为主要特征的疾病。又称子舌、重古舌、雀舌、莲花舌、莲花钿舌。舌下疼痛,肿起一块,色红或紫,形似舌下重
  • 运动功能减退运动功能减退症是指一种身体运动能力下降的病症。这种病往往与其他疾病相关连,例如:基底节疾病(如帕金森氏症)、心理健康失调和因疾病而长期不作任何活动所致。运动功能减退症包
  • 第62空运联队美国空军第62空运联队(英语:62nd Airlift Wing, 62 AW)是美国空军机动司令部美国第十八航空队下属的航空联队,驻扎美国华盛顿州的刘易斯-麦克德联合基地(英语:Joint Base Lewis–M
  • 达尔富尔战争达尔富尔战争(阿拉伯语:الحرب في دارفور‎)发生在苏丹共和国西部的达尔富尔,交战方主要分别为游牧的巴加拉族组成的牧民武装部队,以及巴加拉族以外的定居部落。苏丹
  • 性倾向人口统计性倾向人口统计是一个广受争论的话题。由于各种原因,人们难以取得准确的LGBT人口数据。此外,不同的调查对象也可能影响调查结果。据2012年至2013年的一份调查(样本数20,055人),澳
  • 赵源震赵源震(朝鲜语:조원진,1959年1月7日-),是大韩民国的政治人物,韩国国会大邱达西区丙(朝鲜语:대구 달서구의 국회의원)议员,曾参选2017年大韩民国总统选举。赵源震从韩国外国语大学政治学
  • 毛利就隆毛利就隆(1602年10月17日-1679年9月12日)是江户时代的大名。周防下松藩和德山藩初代藩主。就隆系毛利家初代。父亲是毛利辉元。受兄长秀就授与偏讳,亦取祖父隆元名中一字,于是以
  • 费奥多尔·费奥多罗维奇·乌沙科夫费奥多尔·费奥多罗维奇·乌沙科夫(俄语:Фёдор Фёдорович Ушако́в, 1744年1月24日——1817年10月14日)帝俄皇家海军上将和俄罗斯帝国十八世纪最杰出的海军