语音合成

✍ dations ◷ 2025-11-20 05:33:40 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 医学遗传学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学医学遗传学(英语:medical genetics)是将
  • 系统生物系统(Biological system),又称身体系统(Body system)、器官系统(Organ system),是生物的其中一个组成部分,是由许多不同的器官共同组合而成,执行某种特定的生理作用。人体的系统是
  • 封闭经济封闭经济是一种"自给自足"的体制.这个术语常用于描述一国的政治体制或经济系统. 实行封闭经济的实体可以在没有外部援助或国际贸易的情况下生存和维持。但封闭经济不一定指
  • 日耳曼日耳曼可以指:
  • 8世纪公元701年1月1日至800年12月31日的这一段期间被称为8世纪。武则天死后,李氏再度执掌大唐帝国,唐玄宗时期出现了开元盛世。安史之乱是唐由盛转衰的转折点,决定了8世纪后期军阀割
  • 泪器泪器是副眼器的一种,由泪腺和泪道组成。泪器的功能是产生并运输眼泪。泪道是泪器的一部分,包括泪点、泪小管、泪囊和鼻泪管。泪小管属于泪道,是泪器的一部分,是连接泪点与泪囊的
  • 听障奥林匹克运动会听障奥林匹克运动会(英文:Deaflympics),简称听障奥运、听奥,又称听障林匹克运动会、听障运动会,原名世界聋人运动会,是国际听障运动总会(International Committee of Sports for the
  • 琳·马古利斯琳·马古利斯(英语:Lynn Margulis,也译作林恩·马古利斯,姓或译作玛格丽斯,1938年3月15日-2011年11月22日),美国生物学家,马萨诸塞大学阿默斯特分校在地球科学系的大学教授,天文学家卡
  • 阿尔比十字军十字军 教皇国卡特里派 图卢兹公国(英语:County of Toulouse)英诺森三世 何诺三世 格列高利九世 西蒙·德·蒙特福特(英语:Simon de Montfort, 5th Earl of Leicester) †
  • 三学三学(梵语:śikṣā,巴利语:sikkhā)或三无漏学,佛教术语,分别指增上戒学(adhisīla-sikkhā)、增上意学或增上心学(adhicitta-sikkhā)、增上慧学(adhipaññā-sikkhā),简称为戒、定、