音频信号处理

✍ dations ◷ 2025-02-23 07:19:52 #音频电子学,信号处理

音频讯号处理,又称音讯处理,音乐讯号处理等,可以用来调整音乐讯号的震幅、频率、波形等资讯。

利用一些简单的加减乘除,升降频,及窗函数(window function),就可以做出各式的声音讯号,创造属于自己的电子音乐。

甚至透过一些讯号处理的技巧,可以从声音讯号取得背后所代表的频率高低,做更进一步的分析与应用。

音讯的三个特征:音量、音频、音色。

执行MATLAB函数:audioinfo(音讯档案名称)

1.音量控制:音量是一种相对讯号,在讯号中代表得是振幅,其计算方式是将范围内的讯号取平方相加,在以10为底取log,单位是分贝(dB)如下公式:

但是,在对人耳来说,音量是一种主观的感受,根据佛莱彻森曲线(Fletcher-Munson Curve),在不同频率之下,人耳要听到声音的话,对音量有一个最低要求,如下图所示。反过来说,虽然声音讯号的振幅相同,但是因为频率高低不同,对人耳的感受大小也会不同,相同声音强度,耳朵对低频的感受度较差,对3000Hz左右的声音感受度最高,越往高频又会慢慢降低。调整音量最简单的方式就是用加减法,首先把要处理的范围框出来,接着计算出振幅大小,最后再减掉想要减少的振幅强度,就可以降低音量,反之用加法就可以增强区域的音量。

在不同频率之下,人耳对声音的敏感度会有所不同。

2.音频控制:音频是声音讯号处理的核心部分,最常用的简单处理方式是增频和降频。音频代表得是讯号的音高,中音Do的频率约在262Hz,在音乐中,有C(Do),#C(#Do,♭Re),D(Re),#D(#Re,♭Mi),E(Mi,♭Fa),F(Fa),#F(#Fa,♭Sol),G(Sol),#G(#Sol,♭La),A(La),#A(#La,♭Si),B(Si),12个特定的音阶,每差12个音阶,频率会变为原来的两倍,其频率设定是以440Hz为标准音频,做进一步数学推算,其频率为440乘上2的n/12次方,其中n是上面列出的第几个音阶。音频的处理最常用的是升频和降频,先选出想要处理的区域,接着做升降频的动作,这其中必须要注意奈奎斯特理论,避免讯号失真。

frequency = 2n/12 * 440

3.频率分析:透过离散傅立叶转换(Discrete Fourier Transform),通常简称为DFT,可以将一段声音讯号转换成其各个频率的正弦波分量,方便做更进一步的分析、运算。下图是将频率为440Hz的正弦波讯号,借由MATLAB function: fft,可以得到讯号组成频率的分量,从图上可以看到在440Hz的地方有特别大的值。

将正弦波的讯号,经由傅立叶转换,可以得到讯号组成的频率。

4.音色:每一组声音讯号的波形都不一样,其物理意义是音色,因此如果改变波形的变化,就可以产生出音色类似的声音,处理波形最简单的方法就是用窗函数(window function),利用既有或自制的窗函数,将讯号做简单的convolution就可以改变讯号的波形,创造出不同的音色。

5.倍频:通常音乐的讯号不是单一频率的讯号,而是由基频,以及其泛音(基频的整数倍,倍频)所组成,因此若自制电子音乐时,必须注意倍频对声音饱和度产生的影响。下图将音乐讯号经过频率分析后,可以看到除了在 f 0 = 330 H z {\displaystyle f_{0}=330Hz} 左右的基频外,在 2 f 0 {\displaystyle 2f_{0}} 3 f 0 {\displaystyle 3f_{0}} 的部分也会有较大的分量。

音乐讯号会由基频、泛音所组成,经过频率分析后,分量在基频倍数的地方有较大的值。

6.端点侦测:端点侦测的目的是使讯号处理的范围更精确,方法很简单,只要设定一个音量阈值,若讯号小于阈值,则将其视为没讯号,但是若噪声过高,则会产生误差。

http://djj.ee.ntu.edu.tw/ADSP7.pdf

相关

  • 姚守拙姚守拙(1936年3月-),上海松江人,中国化学家,中国科学院院士,湖南大学、湖南师范大学教授,原苏联列宁格勒大学化学系毕业。现为湖南省政协副主席。
  • 阿桂阿桂像阿桂(满语:ᠠᡤᡡᡳ,转写:agūi;1717年9月7日-1797年10月10日),字广廷,章佳氏,初为清满洲正蓝旗人,以平回部驻伊犁治事有劳,改隶正白旗人。阿桂七世祖穆都巴颜早先居住在长白山俄
  • 基辅的攻势中基辅战役是第二次世界大战中在乌克兰的一场大型包围战;今天它被认为是历史上最大规模的包围战,它作为巴巴罗萨作战在1941年8月23日至9月26日,在苏联历史中它被称为基辅防御战役
  • 多格拉人多格拉人(旁遮普语、喀什米尔语、多格拉语、印地语、乌尔都语:ڈوگرا / डोगरा;藏语、拉达克语:སྀན་པ 或 ཤྀན་པ;英语:Dogras)是分布于南亚的北方印度雅利安人种
  • 友善的人工智能友好的人工智能(简称FAI或友好的AI)是一种假设性理想型的通用人工智能 (AGI)。,它将为人类带来积极影响而不是消极影响。它是人工智能道德的一部分,与机器道德紧密联系在一起。
  • 杨秋香杨秋香(越南语:Dương Thu Hương,1947年-)是越南作家,出生于太平省太平市。杨秋香青年时曾参加越南战争,战后开始写作,并因此成名。1989年因批评政府而被驱逐出越南共产党。
  • 赫曼·彼得·德·波尔赫曼·彼得·德波尔(Herman Pieter de Boer,1928年2月9日—2014年1月1日)也被称为约翰尼·奥斯特利茨(Johnny Austerlitz),是荷兰作家、记者和作词人,他从事该工作长达55年。
  • 巴音比利格巴音比利格(1916年10月5日-1987年5月3日,当代中国大陆译法巴音毕力格),汉名乐竹芳,热河昭乌达盟克什克腾旗人,曾任第一届国民大会代表。父乐景涛为民初国会议员乐山之长子,曾为克什
  • 姚文栋姚文栋(1853年-1929年),字子梁,号东木,江苏嘉定(今上海市嘉定区)南翔镇人,地理学家、藏书家。1881年前往日本出使,1891年6月担任二品衔直棣候补道,1902年3月担任山西大学堂首任督办,1906
  • 金野润金野润(1975年12月23日-)日本的男性声优,千叶县出生,所属事物所为Production baobab。