声学模型

✍ dations ◷ 2025-11-24 09:09:21 #计算语言学,语音识别

声学模型(Acoustic model)是语音识别系统中最为重要的部分之一,目前的主流系统多采用隐马尔科夫模型进行建模。隐马尔可夫模型的概念是一个离散时域有限状态自动机,隐马尔可夫模型HMM是指这一马尔可夫模型的内部状态外界不可见,外界只能看到各个时刻的输出值。对语音识别系统,输出值通常就是从各个帧计算而得的声学特征。用HMM刻画语音信号需作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态(或当前的状态转移)有关,这两个假设大大降低了模型的复杂度。HMM的打分、解码和训练相应的算法是前向算法、维特比算法和前向后向算法。

声学模型的输入是由特征提取模块提取的特征。一般来说,这些特征是多维的向量,并且其取值可以是离散或连续的。早期的声学模型常常采用矢量量化(Vector Quantification)的方法,将信号直接映射到某个码本 k {\displaystyle k} ,根据上下文的不同将其拆分成不同的建模单元。例如,用表示在之后,之前发音的具体实现。上下文的选择方法有很多,最常见的是三音子建模单元,也就是考虑左上文右下文各一个音子,加上中心音子形成三音子对。

上下文相关建模大大提高了建模的准确性,但是同时也使得模型数量急剧膨胀,使得模型的可训练性大大降低。为了解决这一问题,就需要引入某些聚类算法来减少模型中需要训练的参数。

为了解决模型参数过多的问题,可以使用某些聚类方法来减小模型中的参数数量,提高模型的可训练性。聚类可以在模型层次,状态层次乃至混合高斯模型中每个混合的层次进行。可以将半连续隐马模型看作进行高斯混合进行聚类后的连续隐马模型。目前应用最多的方法是对状态聚类的方法。其思路是,根据状态间混合高斯模型概率输出的相似性,将输出概率接近的状态聚合在一起,以便对其的训练更加充分。聚类的方法有基于规则的方法和数据驱动方法两类。

聚类后的状态被称为Senone,每个Senone都是完整独立的高斯混合模型,它也是解码过程中的最基本单元。

传统上,参数估计使用的方法为Baum-Welch算法,属于最大似然准则下的EM算法。目前研究者提出了多种区分性训练方法(仍然属于产生式模型,但使用区分性准则)进行训练,取得了较好的效果。

相关

  • 疫苗疫苗是用细菌、病毒、肿瘤细胞等制成的可使机体产生特异性免疫的生物制剂,通过疫苗接种使接受方获得免疫力。英语中,疫苗一词“vaccine”源自于爱德华·金纳所使用的牛痘。“v
  • 囊泡虫囊泡虫总门(学名:Alveolata)是一大类原生生物.囊泡虫类可分为4个门, 在形态上具有非常大的多样性,但根据细胞内的超微结构与基因具有密切亲缘关系:帕金虫属(Perkinsus)可能属于
  • 乏核燃料乏核燃料是经受过辐射照射、使用过的核燃料,通常是由核电站的核反应堆产生。这种燃料无法继续维持核反应。乏核燃料中仍然包含有大量的放射性元素,因此具有放射性,如果不加以妥
  • 舌背舌背音(dorsal consonant),亦称舌中音、舌面音(舌面中音),是由舌头 (背部)中间部分所发出的语音。在发音上与舌面前音及舌根音均为对立,因舌面前音以舌的前面来发音,而舌根音以
  • 北林肯北林肯郡(North Lincolnshire),英国英格兰约克郡-亨伯林肯郡的Borough,英格兰的单一管理区、人口159,000,面积846.31平方公里。行政总部位于斯肯索普(Scunthorpe),以南234公里(145英
  • 阿拿尔多·诺瓦埃斯·多斯桑托斯阿拿尔多·诺瓦埃斯·多斯桑托斯(Agnaldo Novaes dos Santos,1978年03月7日-),出生于萨尔瓦多,巴西职业足球运动员,司职中场。
  • 土井利隆土井利隆(日语:土井利隆/どい としたか ,1619年-1685年4月1日)是日本江户幕府若年寄(日语:若年寄),同时是下总古河藩第2任藩主,为土井家宗家第2代。元和5年(1619年),作为下总佐仓藩主(其后
  • 高友玑高友玑(1461年-1546年),字肃政,号南屏,浙江乐清(今乐成镇)人,明朝政治人物,弘治庚戌进士,官至刑部尚书。浙江乡试第五十五名,弘治三年(1490年)庚戌科进士,历官刑部郎中,出为九江府知府,因才干
  • 独孤彦云 (溧阳县公)独孤彦云(?-?),京兆人,北周独孤信部下独孤屯之孙,隋朝并州总管、汝阳郡公独孤楷之子,李渊太原起兵原从功臣,武德九年(626年)六月四日参与了玄武门之变,因功封幽州都督、潥阳县公,死后陪葬
  • 新捷运新捷运(英语:SBS Transit,SGX:S61)是新加坡的两大公共交通机构之一。它经营新加坡的地铁、轻轨系统及巴士业务。该公司在1978年成立,当时称为“新加坡巴士(一九七八)有限公司”(新巴,S