首页 >
语音合成
✍ dations ◷ 2025-11-20 12:29:15 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 梅毒梅毒是一种细菌型的性感染疾病,病原体是螺旋菌菌种梅毒螺旋体(英语:Treponema pallidum)的一种亚种(Treponema pallidum pallidum)。其病原体最早是由德国的埃里克·霍夫曼(英语:Eri
- 镁3s22, 8, 2蒸气压第一:737.7 kJ·mol−1 第二:1450.7 kJ·mol−1 第三:7732.7 kJ·mol−1 (主条目:镁的同位素镁(Magnesium)是一种化学元素,它的化学符号是Mg,它的原子序数是12,是
- 汉弥尔顿·史密斯汉弥尔顿·奥塞内尔·史密斯(英语:Hamilton Othanel Smith,1931年8月23日-),美国微生物学家。因1970年代在约翰·霍普金斯大学发现限制性内切酶而与丹尼尔·那森斯(Daniel Nathans)
- 毛囊毛囊是用来生长毛发的皮肤器官,分布在除了手掌、脚掌和嘴唇以外的全身体表皮肤上。毛囊与皮脂腺相连,毛发密度越高的地方皮脂腺的数目就越多。毛囊还与一小束肌肉纤维相连,称作
- 龙王鲸龙王鲸(学名:Basilosaurus,意为“帝王蜥蜴”),又名械齿鲸(Zeuglodon),已经绝种的古代海洋哺乳动物,现代鲸鱼的近亲,是鲸下目中的一个属,生存于4,000万至3,500万年前的始新世晚期。龙
- 原生质体原生质体的英语(Protoplast)来自于古希腊语 πρωτόπλαστος 读prōtóplastos,有"首先形成"的意思。这个词在宗教语境中代表第一个人,或者更广泛的说法是一个物种的
- 伊斯兰国家穆斯林世界有几种含义。在宗教意义上说,它是指那些坚持伊斯兰教法的国家。在文化意义上说,它指的是伊斯兰文明,不包括生活在该文明的非穆斯林(齐米)。在现代的地缘政治意义上,该术
- 儒勒·哈杜安·孟萨尔儒勒·哈杜安·孟萨尔(法语:Jules Hardouin Mansart,1646年4月16日-1708年3月11日),活动于17世纪后期至18世纪初期的欧洲法国建筑师。他的作品被认为是法国巴洛克建筑的先端,亦为法
- 利物浦大学利物浦大学(University of Liverpool)是一所位于英国的研究型大学,位于英格兰利物浦市。学校是著名的罗素大学集团和N8研究合作集团(N8 Research Partnership)的创始成员,其商学与
- 艾尔基·罗斯拉堤艾尔基·罗斯拉堤(芬兰语:Erkki Ruoslahti,1940年2月16日-),芬兰裔美国医学家,美国国家科学院院士,加州大学圣塔芭芭拉分校教授。罗斯拉堤名列汤森路透引文桂冠奖,被看好角逐诺贝尔生
