语音合成

✍ dations ◷ 2025-11-24 12:12:14 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 打火机打火机,是一种工具,它可以生出火焰,有燃烧式的和电流式的两种。在大部分地区,它取代了过去的钻木取火、打火石、火折子、火柴等取火方式,成为现代社会的取火象征。燃烧式的打火机
  • 胆道胆管为胆汁由肝脏传送至十二指肠的一个管道。肝内的胆小管逐级合并成左、右肝管,出肝门再合成为肝总管;肝总管与胆囊管汇合成胆总管。肝细胞持续不断的制造胆汁浓缩并储存于胆
  • 乙酰胺酚7.21 g/kg (0 °C) 8.21 g/kg (5 °C) 9.44 g/kg (10 °C) 10.97 g/kg (15 °C) 12.78 g/kg (20 °C) ~14 mg/mL (20 °C)对乙酰氨基酚(英语:Acetaminophen),又称
  • 湖广填四川湖广填四川是指发生在元朝末年到明代洪武年间和清代顺治到乾隆年间的两次大规模的湖广省(今湖北与湖南全境、广东北部等)的居民迁居到四川各地拓垦的移民潮。根据考证表明,江西
  • 男男男男性行为,是指男性跟男性一同从事的性行为,而不论从事者的性倾向或性别认同为何。《金赛报告》的著者于1948年指出37%的男性受访者有过至少一次的同性性行为经历。证据显示
  • 同化类固醇合法性蛋白同化甾类(英语:Anabolic steroid)是一种能够促进细胞的生长与分化,使肌肉扩增,甚至是骨头的强度与大小的甾体激素。同化激素是由天然来源的雄性激素经结构改造,降低雄激素活性
  • 探测车巡视器(英语:rover 或 planetary rover)是一种太空探索中,用于在行星或其他天体的表面移动的车辆。目前人类发射的月球车、火星车都成功登陆过月球和火星。
  • 酸酐水解酶酸酐水解酶是一类催化酸酐键水解的水解酶。它们被归类于EC编号 3.6。该类中一个众所周知的成员是GTPase。EC 1.1/2/3/4/5/6/7/8/9/10/11/12/13/14/15/16/17/18/19/20/21/22
  • 艾美奖艾美奖(英语:Emmy Award)是美国一项用于表彰其电视工业杰出人士和节目的奖励,其重要程度等同于电影界的奥斯卡金像奖(英语:Academy Award)、音乐界的格莱美奖(英语:Grammy Awards)以及
  • 沃尔什滕沃尔什滕(波兰语:Wolsztyn)是位于波兰大波兰省中央的一个镇。坐标:52°07′N 16°07′E / 52.117°N 16.117°E / 52.117; 16.117