语音合成

✍ dations ◷ 2025-11-19 15:32:32 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 职业病职业病是是指企业、事业单位和个体经济组织等用人单位的劳动者在职业活动中,因接触粉尘、放射性物质和其他有毒、有害因素而引起的疾病。这一概念不仅限于生产性质的企业,也包
  • 白细胞介素1结构 / ECOD介白素-1包括11种细胞因子,在机体控制免疫和炎症反应中具有重要作用。这些细胞因子的发现始于1943年至1948年间,Menkin和Beeson对兔子腹腔细胞释放的致热原蛋白质
  • 种痘天花疫苗用以预防天花。古代民众预防天花的方法。其具体方法是把天花病患者身上的痘痂制浆(脓),以小刀拭在受种者的皮肤之下,使之产生免疫力,以预防天花。另一个方法,就是让受种者
  • 威斯康星大学威斯康星大学是美国威斯康星州的州立大学系统,有着超过170年的悠久历史。其旗舰学府威斯康星大学麦迪逊分校坐落于美国密歇根湖西岸的威斯康星州首府麦迪逊。威斯康星大学一
  • 生化反应生物化学(英语:biochemistry,也作 biological chemistry),顾名思义是研究生物体中的化学进程的一门学科,常常被简称为生化。它主要用于研究细胞内各组分,如蛋白质、糖类、脂类、核
  • 锶-90锶-90是锶元素一种具放射性的同位素,半衰期为29.1年,外观为有光泽的银色金属,但与空气接触后会迅速转为黄色,可经由β衰变形成钇-90(英语:Yttrium-90),其衰变能(英语:Decay energy)为0.
  • 威士忌威士忌(苏格兰与加拿大产的威士忌拼法为Whisky,而美国与爱尔兰产的威士忌在拼字上稍有不同,称为Whiskey)是一种只用谷物做为原料、含酒精的饮料,属于蒸馏酒类。广义解释,“威士忌
  • 詹姆斯·蒙哥马利·弗拉格詹姆斯·蒙哥马利·弗拉格(英语:James Montgomery Flagg;1877年6月18日-1960年5月27日),是一位美国艺术家和插画家。他从纯粹的绘画工作转变为卡通画家,但却以他绘制的政治海报而闻
  • J·K·罗琳乔安娜·罗琳,CH,OBE,FRSL(英语:Joanne "Jo" Rowling,1965年7月31日-),笔名J·K·罗琳(英语:J. K. Rowling)及罗柏特·加尔布雷斯(英语:Robert Galbraith),英国小说家、电影编剧及制片人,代表
  • 柏林市柏林(德语:Berlin,德语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Gent