首页 >
语音合成
✍ dations ◷ 2025-11-29 06:07:54 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 食品添加剂食品添加剂是为了保持味道或增强口感、改善外观添加到食物中的物质。 一些添加剂已经使用了几个世纪;例如,(用醋)腌制、盐腌来保存食物(如腌肉),糖果的保存以及用二氧化硫来保存葡
- 德古西加巴特古西加尔巴(西班牙语:Tegucigalpa)是洪都拉斯的首都及第一大城,人口894,000(2006年),位在洪都拉斯中部,名为特古西加尔巴的山谷中,海拔975米。该名的意思是“银色的山”。特古西加
- 阿尔基罗库斯卡尔基罗库斯(英语:Archilochus),(前680年-前645年)。古希腊最早的抒情诗人。与荷马齐名。他曾参与殖民萨索斯的相关活动,后于此阵亡。他因为女儿内奥布勒的出嫁一事与吕坎拜斯发生
- 奥卡姆的威廉奥卡姆的威廉(William of Ockham/Occam,约1285年-1349年),又译为奥坎、奥康,出生于英格兰的萨里郡奥卡姆(Ockham),在大学注册为奥卡姆的威廉。14世纪逻辑学家、圣方济各会修士。奥卡
- 手术刀手术刀,在中文也常称柳叶刀,是根据它的形状来称呼的名字。是一种做外科手术时用来切割的一种医疗器械。一把手术刀由一个刀柄和一个刀刃组成,大部分都以不锈钢制造。刀刃可以有
- 物理光学物理光学(英语:physical optics),又称波动光学(wave optics)是光学的一个分支,研究的是关于干涉、衍射、偏振与其它在几何光学里射线近似不成立的种种现象。假设光波的波长超小于仪
- 南方古猿曾被界定为南方古猿属的种:南方古猿属(学名:Australopithecus)是人科动物的一个已灭绝的属。是猿类和人类的中间体型。南方古猿这个属之中最著名的是阿法南方古猿与非洲南方古猿
- iSsupso/s/supsub298K/sub标准摩尔熵(英语:standard molar entropy)指在标准状况(298.15 K,105Pa)下,1摩尔纯物质的规定熵,通常用符号S°表示,单位是J/(mol·K)(或作J·mol−1·K−1,读作“焦耳每千克开尔文”)。
- ΑAlpha(Άλφα;大写Α,小写α,中文音译:阿尔法、阿拉法),是第1个希腊字母。小写α用于物理学上:小写α用于数学上:“Alpha”常用作形容词,以显示某件事物中最重要或最初的,例如软件工
- 马塞尔·普鲁斯特马塞尔·普鲁斯特(Marcel Proust,1871年7月10日-1922年11月18日),法国意识流作家,全名为瓦伦坦·路易·乔治·欧仁·马塞尔·普鲁斯特(Valentin-Louis-Georges-Eugène-Marcel Prou
