语音合成

✍ dations ◷ 2025-11-27 17:12:12 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 肺孢子菌纲P. carinii P. jirovecii P. murina P. oryctolagi P. wakefieldiae肺孢子菌纲只有一目、一科、一属,是外囊菌亚门中一类比较原始的真菌,直到20世纪初才被发现,是一种类酵母
  • 生活品质马斯洛的需求金字塔上达到越高层的人可以视同生活质量越高自我实现的需求尊重需求(社会承认需求)社交需求(社会关系需求)安全的需求生理的需求(身体基本需求)生活质量(Quality of L
  • 巨环内酯大环内酯(macrolides),或称大环内酯,是一组其作用在于结构内的“大环”的药物(一般都是抗生素),这个大环亦即是一连结一个或多个脱氧糖(多是红霉糖(英语:cladinose)及去氧糖胺(英语:desos
  • 膀胱炎膀胱炎 是指膀胱发炎的状态,在女性较为常见,但各年龄层的男女都可能罹患。膀胱炎可分为以下几类:
  • 突变原突变原(英语:Mutagen,又译致变原、致突变原、致突变剂或诱变剂等)是指一些能使生物体内的遗传讯息(通常是脱氧核糖核酸)发生变化的物理或化学因子。生物若处于这些因子的作用下,发
  • 氟硝西泮氟硝西泮(学名:Flunitrazepam、或称FM2、罗眠乐、氟硝安定、氟硝基安定、氟甲硝安定、十字架、十字仔),由罗氏药厂制造,取它们的成分Flunitrazepam的首尾字母加原剂型每锭两毫克
  • Fendi芬迪(Fendi)是一家意大利流行品牌公司。最为人所熟之的为该公司的贝贵(原文为baguette,法国面包之意)手提包以及其双F之图案。Fendi在公元1925年成立,本来是一间罗马的皮草商店,现
  • 苜蓿褐斑苜蓿 Medicago arabica 天蓝苜蓿 Medicago lupulina 小苜蓿 Medicago minima 扣形苜蓿 Medicago orbicularis 南苜蓿 Medicago polymorpha 早花苜蓿 Medicago praecox M
  • 新泽西新泽西州(英语:State of New Jersey),简称新州,是美国第四小以及人口密度最高的州,邮政缩写NJ。其命名源自位于英吉利海峡中的泽西岛;其昵称为“花园州”。新泽西州通常被划分在美
  • 约塞米蒂国家公园约塞米蒂国家公园(英语:Yosemite National Park、/joʊˈsɛmᵻti/ yoh-SEM-it-ee)是美国加州中东部横跨图奥勒米县、马里波萨县和马德拉县东部部分地区的国家公园。该公园占地