语音合成

✍ dations ◷ 2025-12-03 13:08:47 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 孔道蛋白结构 / ECOD2fgrA:21-351 2fgqX:20-351 1pho :27-351 1iivA:27-378 1osmA:27-363 1opfD:28-362 1mpf :28-362 2omf :28-362 1gfm :28-362 1hxuA:28-362
  • 盐桥盐桥 (Salt bridge) 在化学上是指一种实验装置,用以连接贾凡尼电池(伏打电池,一种电化电池)的氧化半电池和还原半电池。盐桥通常分为两类:玻璃管型和滤纸型。此型盐桥由U型管和填
  • 肝胆肠胃科胃肠学(英语:Gastroenterology,又称为肠胃病学)是医学的一个分枝,专门研究消化系统(从口腔到肛门的消化道)及相关疾病。
  • β-酮硫解酶缺乏症β-酮硫解酶缺乏症是一种罕见的常染色体隐性代谢疾病,全世界仅报告有50至60例。患者机体无法正确处理异亮氨酸或脂质分解产物,典型发作年龄为6个月至24个月。该病症由ACAT1基
  • X-连锁淋巴增生症X连锁淋巴细胞增生性疾病(X-linked lymphoproliferative disease),又名邓肯病(Duncan's disease):86或珀蒂洛综合征(Purtilo syndrome),是一种淋巴增生性障碍(英语:lymphoproliferativ
  • 亚硝酸异戊酯亚硝酸异戊酯(化学式:C5H11ONO)是异戊醇生成的亚硝酸酯。无色至淡黄色、青黄色具有挥发性澄清液体。有水果香味。不溶于水,能溶于醇、醚。遇光和空气分解。由异戊醇和亚硝酸钠酯
  • 硫循环硫循环(英语:Sulfur cycle)是一些过程的集合,其中包括硫在矿物质(包括水体)和生命系统之间移动进出过程。这样的生物地质化学循环对于地质学是重要的,因为它们会影响多种矿物质。生
  • 莫里斯·德弗拉曼克莫里斯·德·弗拉芒克(Maurice de Vlaminck,1876年4月4日-1958年10月11日),法国画家。他一开始是后印象派的成员,后经安德烈·德兰介绍加入了野兽派,并成为该流派的主要代表之一。
  • 埃博拉病毒属埃博拉病毒属(学名:Ebolavirus)是丝状病毒科的其中一种病毒,可导致埃博拉出血热,罹患此病可致人于死,包含数种不同程度的症状(包括恶心、呕吐、腹泻、肤色改变、全身酸痛、体内出血
  • 扎伊尔省萨伊省位于安哥拉西北端,与本哥省、威热省等省份及刚果民主共和国相邻。