语音合成

✍ dations ◷ 2025-11-15 03:17:53 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 氢氯噻嗪氢氯噻嗪(英语:Hydrochlorothiazide,简称HCTZ、HCT或HZT)是一种利尿剂。通常用来治疗高血压及因液体堆积造成的水肿。其他用途还包含治疗尿崩症和肾小管性酸中毒,它也可以减轻高
  • 地塞米松地塞米松(Dexamethasone,简称DXMS)是一种人工合成的皮质类固醇,可用于治疗多种症状,包含风湿性疾病,某些皮肤病、严重过敏、哮喘、慢性阻塞性肺病、义膜性喉炎、脑水肿(英语:cerebra
  • 2012年现象2012年预言或2012年现象(英语:2012 phenomenon)是一个关于末世论的预言、信仰或传说、谣言,宣称美洲的玛雅文明中的玛雅历长达5,126年周期的结束,预言了地球、世界和人类社会在公
  • 机电整合机电整合可以指:
  • 甜蜜素甜蜜素(Sodium cyclamate),又称甜精,化学名环己基氨基磺酸钠,一种甜味剂。甜蜜素在1937年被伊利诺伊大学的学生麦克尔·斯维达(Michael Sveda)发现,1950年代开始应用于软性饮料工业,1
  • 层br /侵br /纪层侵纪(Rhyacian,符号PP2)是地质时代中的一个纪,开始于同位素年龄2300±0百万年(Ma),结束于2050±0Ma。层侵纪期间蓝藻、细菌繁盛。此时期形成布希维尔德火成岩复合体(英语:Bushveld
  • 酿造醋酿造醋是以谷类等天然原料为主,再加上食盐、谷皮等发酵而成的食醋。醋一般按造制作方式可分成三种,包括酿造醋、合成醋、加工醋,其中以酿造醋品质最好,多用于直接烹饪或凉拌之用
  • 杜贝莱约阿希姆·杜·贝莱(英语:Joachim du Bellay, 1522年-1560年),文艺复兴时期欧洲诗人。他为七星诗社的成员,1549年发表最早的法语彼特拉克的十四行诗。其著作包括拉丁语诗歌和讽刺
  • Escherichia coli大肠杆菌(学名:Escherichia coli,通常简写:E. coli)是人和动物肠道中著名的一种细菌,主要寄生于大肠内,约占肠道菌中的0.1%。大肠杆菌是一种两端钝圆、能运动、无芽孢的革兰氏阴性
  • 电量电荷量简称电量,是物体所带电荷的量值,电量的国际单位是库仑,符号 C {\displaystyle \mathrm {C} } 。常用的