首页 >
语音合成
✍ dations ◷ 2025-12-07 00:02:58 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 黏液层黏液层(slime layer)为一种细菌的特殊构造,它是围绕细菌细胞的一层很容易除去(比如通过离心的方法),而且无规则的物质。黏液层的主要化学成分为外多糖、糖蛋白,以及糖脂。值得注意
- 去颤去颤(defibrillation),也称除颤,是指对于危及生命的心律不整(cardiac dysrhythmias)、心室颤动(ventricular fibrillation)、无脉性心室频脉(Pulseless VT(英语:Pulseless VT))一种常见的
- Boston新英格兰波士顿(英语:Boston)为美国马萨诸塞联邦(英语:Commonwealth (U.S. state))首府,占地面积 48平方英里(124 km2),2018年居民总数为694,583位,是马萨诸塞乃至新英格兰地区人口最
- 大肠钡剂灌肠造影大肠钡剂灌肠造影(Barium Enema),简称钡剂造影,是将硫酸钡乳液灌入患者的肛门,让患者的结肠、直肠和大肠在X射线下成像。硫酸钡在人体内不溶,可以附着在消化道管壁上,阻挡X射线穿过
- 长崎大学长崎大学(日语:長崎大学/ながさきだいがく Nagasaki daigaku;英语译名:Nagasaki University),简称长大(ちょうだい),是一所位于日本九州长崎县长崎市的国立大学,前身之一长崎医科大学
- 滤泡刺激素促卵泡激素(英语:follicle-stimulating hormone, FSH,亦称为卵泡刺激素)是一种由脑垂体合成并分泌的激素,属于糖基化蛋白质激素,因最早发现其对女性卵泡成熟的刺激作用而得名。后
- 鼓鼓部,为汉字索引中的部首之一,康熙字典214个部首中的第二百〇七个(十三划的则为第三个)。就繁体和简体中文中,鼓部归于十三划部首。鼓部只以上方为部字。且无其他部首可用者将部
- 氯化烯丙基钯二聚物氯化烯丙基钯(II)二聚物是一个化合物,其化学式为(η3-C3H5)2Pd2Cl2。此一黄色且空气稳定的化合物是有机合成中的一个重要的催化剂。此化合物是经由将一氧化碳通入氯化钯、氯
- CCa有机钙化学是研究碳-钙键的化合物的化学分支。金属钙和卤代烃反应,可以得到RCaX,在反应中通常会先加入碘、镁或将钙制成汞齐来活化。用氯代烃和溴代烃反应的产率都较低。用二
- σ因子σ因子(sigma factor),原核生物RNA聚合酶上的一个亚基。可以协助聚合酶与模板链上的启动子专一性的识别并结合,极大地提高聚合酶对DNA启动子区的结合力。原核生物会使用不同的σ
