首页 >
语音合成
✍ dations ◷ 2025-11-23 04:30:43 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 复方新诺明扑菌特(Trimethoprim/sulfamethoxazole, TMP/SMX),较为人知的名称是复方新诺明、磺胺剂(co-trimoxazole),是一种用来防治多种因为细菌而引起感染的抗生素,用以治疗各种细菌感
- 上升流上升流,或称为涌升流,是一种海洋学现象,是由风力驱动温度较低、密度较大、通常富含营养的海水流向海表面,取代温度较高、通常缺乏营养的表层海水。上升流至少有五种类型:沿岸上升
- 渔业渔业、水产业是指采捕或养殖水生动物、植物的生产事业和行业。渔业狭义上指捕捞渔业或称捕鱼业、渔捞业,可细分近海渔业和远洋渔业。此外,渔业还有一种叫养殖渔业(或称水产养殖
- European Union乌尔苏拉·冯德莱恩欧洲联盟(英语:European Union;西班牙语:Unión Europea; 法语:Union européenne;德语:Europäische Union),简称欧盟(英语:EU;西班牙语:UE;法语:UE;德语:EU),是欧洲多国共
- 埃克塞特坐标:50°43′18″N 3°31′59″W / 50.72154°N 3.53311°W / 50.72154; -3.53311埃克塞特或爱思德(英语:Exeter,读音: /'.mw-parser-output .IPA{font-family:"Charis SIL","D
- 收养在古代罗马,领养男孩是很常见的事,尤其在上层社会元老院阶层中。罗马人普遍认为一个家庭至少要有一个男孩,因为家族需要一个男性继承人,但孩子又不能太多,原因是养育孩子的花费太
- 议会民主制议会制又称内阁制、议会民主制(英语:Parliamentary system),是一种政治制度,特点是“议会无上”,政府首脑(总理或首相)权力来自议会,授权有两种途径:第一是议会改选后的多数议席支持,第
- 血影蛋白血影蛋白(Spectrin),一种细胞结构蛋白,大多位于红血球细胞膜内侧,是红血球骨架的主要成分。血影蛋白在整个细胞膜内侧形成可变形的架构,以维持红血球的双凹圆盘构造。血影蛋白形成
- 1,1,1-三氯乙烷1,1,1-三氯乙烷是一种卤代烃(化学式:CH3CCl3或C2H3Cl3),是一种广泛应用的工业溶剂。其别名包括甲基氯仿及chlorothene,其商品名被称为溶剂 111及Genklene(帝国化学工业公司使用)。
- 阿尔弗雷德·佩罗让-巴蒂斯特·阿尔弗雷德·佩罗(法语:Jean-Baptiste Alfred Perot,法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lu
