语音合成

✍ dations ◷ 2025-12-10 03:41:13 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 普世主义普世主义是哲学上的一个分支,它强调普遍的事实能够被发现且被理解。在伦理上,普世性就是指能够应用在所有人身上的价值观或事物。这种思想存在于许多宗教或哲学体系之中。普世
  • 剪切模量剪力模数(shear modulus)是材料力学中的名词,弹性材料承受剪应力时会产生剪应变,定义为剪应力与剪应变的比值。公式记为其中, G
  • 图书馆馆员图书馆员是负责图书馆运营的专业人员,其工作包括对馆藏资源的采购、加工、描述、流通(借还)、分析报导、点算书籍、盘点书本、检查书籍、把书本排列好次序、上书、帮忙读者寻找
  • 自残自我伤害(英语:Self-harm),又称自残(self-injury),是指有意且直接地伤害身体组织的行为,当事人一般没有自杀的意图。较近期的文献多会使用以上两者去取代较不中立的“自残”,特别是《
  • 超高能量宇宙射线GZK极限,是以提出者Greisen、Zatsepin、Kuzmin三人姓氏之首字母为名的理论上限,描述源自远处的宇宙射线应有的理论上限值。这项极限是在1966年由Kenneth Greisen、Vadim Kuzmi
  • 罗马建城纪年罗马建城纪年(Ab urbe condita,简作AUC、a.u.c. 或 a.u),是古罗马时期历史学家所用的纪年法之一。“Ab urbe condita”在拉丁文中意为“从(罗马)城建立起”。通常将始年定在公元
  • 加缪阿尔贝·加缪(法语:Albert Camus,1913年11月7日-1960年1月4日),生于法属阿尔及利亚蒙多维城,法国小说家、哲学家、戏剧家、评论家,其于1957年获得诺贝尔文学奖。加缪父亲在1914年大
  • 环糊精环糊精是由6个或更多的吡喃葡萄糖分子形成的环状低聚糖的总称,由环糊精葡萄糖基转移酶作用于淀粉所产生。
  • 六氯乙烷六氯乙烷,分子式为C2Cl6。无色斜方有类似樟脑香味的针状结晶。易升华。不溶于水,溶于乙醇、乙醚、氯仿、苯和油类。为氯代烃中毒性最大的一种。对中枢神经有麻醉作用,可损害肝
  • 斯摩棱斯克州斯摩棱斯克州(俄语:Смол́енская о́бласть,罗马化:Smolenskaya oblast)是俄罗斯的一个联邦州,属中央联邦管区的管辖范围。面积49,786平方公里,人口1,049,574(2006