语音合成

✍ dations ◷ 2025-05-17 12:36:52 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 维生素过多症维生素过多症(英语:Hypervitaminosis),亦称维生素中毒症,是指由于摄入过量维生素而引发的一系列中毒症状,这类疾病根据与其有关的维生素的字母进行定名,例如摄入过多维生素A引发的
  • 牛瘟牛瘟病毒(德语:Rinderpest,英语:cattle plague或steppe murrain),是一种具感染性的牛只病毒,会引起牛瘟。这种病毒性疾病主要传染于水牛之间,但其他野生品种也有致病的记录。牛瘟与
  • 阿卓糖阿卓糖(英语:Altrose)是一种己糖,D-阿卓糖是非自然形成的单糖。可溶于水,略溶于甲醇。L-阿卓糖已可从溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)的变种中分离出来。阿卓糖是甘露糖
  • 洛克里洛克里(意大利语:Locri),是意大利雷焦卡拉布里亚省的一个市镇。总面积25平方公里,人口12845人,人口密度513.8人/平方公里(2009年)。ISTAT代码为080043。
  • 泌尿生殖肿瘤生殖系统肿瘤是指病发于生殖系统的肿瘤。其种类包括有:医学导航: 肿瘤基因/标志肿瘤/同名/附瘤药物 (L1i/1e/V03)
  • 异特龙可疑物种异特龙属(属名:Allosaurus)又称异龙或跃龙,是兽脚亚目肉食龙下目恐龙的一属。异特龙是种大型的二足、掠食性恐龙,平均身长为8.5米,最长可达12到13米。它们生存于晚侏罗纪
  • 丹麦文丹麦 格陵兰 法罗群岛 欧盟北欧理事会丹麦语(dansk, dansk 帮助·信息,宽式IPA:/d̥ænsɡ̊/),中文也称丹麦文,属于印欧语系-日尔曼语族-北日尔曼语支,通行于丹麦王国以及其属地
  • 约法三章约法三章原指刘邦攻入秦朝都城咸阳后,一度制定简化秦朝苛法的做法,后来演变成为根本性的法律规定,曾成为“宪法”的名称。约法三章一词,最早出现于《史记》“高祖本纪”。公元前
  • 俄罗斯皇帝俄罗斯君主列表,指俄罗斯由公元862年留里克创立诺夫哥罗德公国开始,到1917年尼古拉二世退位其间,共1055年间的俄国君主的列表。862年,留里克创立诺夫哥罗德公国,是为俄罗斯国家的
  • 战神广场战神广场(法语:Champ-de-Mars)是一个座落于法国巴黎七区的广大带状公园,介于位在其西北方的埃菲尔铁塔,以及在其东南方的巴黎军校之间。这个广场的名称来自罗马的战神广场,法文中