语音合成

✍ dations ◷ 2025-11-26 02:26:41 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 机会性感染机会性感染又名伺机性感染(英语:opportunistic infection)是指由机会性病原体引发的感染。这些病原体寄生于免疫功能正常的健康宿主时不致病,但会在宿主出现免疫缺陷时入侵宿主
  • 东英县东英县(越南语:Huyện Đông Anh/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H",
  • 密苏里州密苏里州(英语:State of Missouri)是美国第24个州,一般被划分在中西部地区之内。州鸟是东蓝鸲,州歌“密苏里华尔兹”,州花为山楂花。密苏里州创建于1821年8月10日,属于路易斯安那购
  • 普拉托普拉托(意大利语:Prato)位于意大利中部,是托斯卡纳大区普拉托省的首府。人口18万多,为托斯卡纳大区第二大城市,意大利中部第三大城市,仅次于罗马和佛罗伦萨。自1950年代以来,该市接
  • Fesub2/subSsub3/sub硫化铁(化学式:Fe2S3),是三种铁的硫化物(英语:iron sulfide)之一,此外还有FeS和FeS2。它是一种固体棕色粉末,但在常温下腐化为黄绿色粉末。这是一种十分不稳定的人造产物,不存在于自然
  • 光解光解(Photolysis)是指化合物被光分解的化学反应。大气中最常见的光解作用有两种,第一种是:O3 + hν → O2 + O1D λ < 320 nm臭氧被光分解成了氧分子和一个处于激发态的氧原子
  • FeBrsub3/sub溴化铁,化学式为FeBr3,棕黄色或深红棕色固体。易溶于水,溶于水略显酸性,其水溶液可以结晶出暗绿色的FeBr3·6H2O。可溶于给电子溶剂(如乙醚、乙醇)中。固体溴化铁具有和氯化铁相似
  • 蔓足下纲(Cirripedia)详见内文藤壶是颚足纲鞘甲亚纲蔓足下纲(Cirripedia,原蔓足纲、蔓足亚纲)生物的通称。所有的藤壶都生活在海洋中,其中绝大部分又生活在潮间带等浅海海域。其幼体(有两个阶段)为自游
  • 爱丁堡大学坐标:55°56′50.6″N 3°11′13.9″W / 55.947389°N 3.187194°W / 55.947389; -3.187194爱丁堡大学(英语:University of Edinburgh)坐落在苏格兰首府爱丁堡市,是一所创建于158
  • 烯丙基烯丙基(Allyl)是丙烯的sp3杂化的碳去掉一个氢后形成的基团。其中与双键碳相邻的碳称为烯丙位。具有该基团的化合物通常可以进行一些特殊的反应,如丙烯重排,丙烯位氧化反应,Ene反