语音合成

✍ dations ◷ 2025-11-30 11:49:31 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 依那西普Etanercept(商品名:恩博)是一种治疗自身免疫疾病的生物制剂,作用机转为干扰肿瘤坏死因子(英语:tumor necrosis factor)(TNF,一种可溶性的发炎性细胞激素)的作用,为肿瘤坏死因子抑制剂(英
  • 西普里安塔修斯·凯斯利乌斯·西普里亚努斯(拉丁语:Thascius Caecilius Cyprianus),英语化后成为居普良(英语:Cyprian, 约200年-258年),圣公会译圣西浦廉,又译西普里安,迦太基教会主教,基督教会
  • 硝化细菌硝化细菌(英语:nitrifying bacteria)是一群好氧的化能自养生物之统称,细菌能通过食用无机氮化合物生长。硝化细菌以二氧化碳为碳源,通过代谢将氨或铵盐氧化成硝酸盐。硝化细菌可
  • 杂交杂交种(英语:hybrid)又称杂种或混种,是指从两种不同的生物杂交产生的后代。依双亲的生殖隔离程度,杂交后代可能无法存活、可存活但无法生殖、可存活并生殖但适应力较低、或是完全
  • 航天发射中心name = 'Aero', description = '航空太空科技(航空航天科技)', content = {{ type = 'text', text = [=[本页面没有类似于NoteTA的数量限制。 请自行修改分类名。在NoteTA样板
  • 蜥脚下目蜥脚下目(学名:Sauropoda)又称蜥脚亚目、龙脚下目、真蜥脚亚目,在希腊文里意为“有蜥蜴般的脚”,是蜥臀目的一个下目,是由奥塞内尔·查利斯·马什(Othniel Charles Marsh)在1878年建
  • 火山口湖国家公园火山口湖国家公园(英语:Crater Lake National Park)或克雷特湖国家公园是位于美国俄勒冈州南部的一个国家公园。火山口湖国家公园是俄勒冈州内唯一的一个国家公园。火山口湖国
  • 德意志德意志裔人(德语:Volksdeutsche),指的是在一次大战后居住在德意志(德国、奥地利)国外——母语以德语为主的多数聚居区,或与德国或奥地利有血缘关系的欧洲居民。例如:位于法国的阿尔
  • 法国文化部政治主题文化部(法语:Ministère de la Culture)是法国政府部门,其成员专门负责管理国家博物馆和历史遗迹,无论在法国或海外都推广和保护各种视觉、造型、戏剧、音乐、舞蹈、建筑
  • 天狗天狗可以指: