语音合成

✍ dations ◷ 2025-12-08 04:10:55 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 头孢哌酮头孢哌酮是第三代头孢菌素类抗生素 ,由辉瑞公司以Cefobid的名义销售 。 它是少数能有效治假单胞菌属细菌(如铜绿假单胞菌)感染的头孢菌素抗生素之一。该药于1974年获得专利,并于
  • 糖皮质激素可治疗性醛固酮增多症糖皮质类固醇可抑制性醛固酮增多症(glucocorticoid remediable aldosteronism,GRA),又名地塞米松可抑制性醛固酮增多症(dexamethasone-suppressible hyperaldosteronism,DSH)或ACTH
  • 环境自然环境指地球或一些区域上一切生命和非生命的事物以自然的状态呈现。这是一个环境涵盖了所有生物之间的相互作用。 自然环境可分为几个主要组成部分:自然环境是对比建成环
  • 心指数心指数 (英语:cardiac index,简称CI)是血流动力学(英语:haemodynamic)中涉及参数的以体表面积(BSA)所计算的每分钟左心室心输出量(英语:cardiac output)(CO),从而比较不同个体之间的心泵
  • 数理逻辑数理逻辑(英:Mathematical logic)是数学的一个分支,其研究对象是对证明和计算这两个直观概念进行符号化以后的形式系统。数理逻辑是数学基础的一个不可缺少的组成部分。数理
  • 纤维肌痛纤维肌痛(英语:Fibromyalgia,简称FM)是一种以慢性扩散疼痛,患者对触碰压力反应剧烈(英语:allodynia)。其他症状还包括过于疲倦致使普通活动受到影响、睡眠障碍以及记忆障碍。也有一
  • 理论物理理论物理学(英语:Theoretical physics)通过为现实世界建立数学模型来试图理解所有物理现象的运行机制。通过“物理理论”来条理化、解释、预言物理现象。:9丰富的想像力、精湛
  • 世界大桥列表世界大桥列表列出世界各国长度超过3,000米(9,800英尺)的桥梁。列表中收录的,尤其是很多排名靠前的桥梁属于高架桥的范畴。目前并没有一种统一的方法来测量桥梁的全长,列表中的数
  • 布朗利河岸博物馆国家凯布朗利博物馆(Musée du quai Branly)是一个法国巴黎博物馆,展示非洲、亚洲、大洋洲和美洲具有特色的艺术和文化。该博物馆靠近埃菲尔铁塔。最近的巴黎地铁和RER车站是阿
  • 华通氏胶华通氏胶(Wharton's Jelly)为构成脐带的凝胶状物质,主要成分是黏多糖(Mucopolysaccharides),也含有成纤维细胞和巨噬细胞,是一种黏膜组织。当婴儿分娩后,温度的改变使华通氏胶内部的