语音合成

✍ dations ◷ 2025-12-01 05:25:28 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 背景调查背景调查是由独立专业机构依托权威数据源,通过合法的途径和方式对被调查人提交的个人背景信息进行核查比对,并形成背景调查报告以辅助委托调查人验证其真伪。通常在企业、政府
  • 阴谋论阴谋论通常是指对历史或当代事件作出特别解释的说法,通常暗指事件的公开解释为故意欺骗,而背后有集团操纵事态发展及结果,以达至该集团损人利己的目的。此类特别解释不同于一般
  • 保久乳保久乳(英语:extended shelf life milk;德语:länger haltbare Milch)是一种牛奶产品,在未开封包装中(若有依指示妥善冷藏)保存期限介于鲜奶(5~7天)和超高温消毒牛奶(3~6个月)之间;营养价
  • 美国儿科学会美国儿科学会(英语:American Academy of Pediatrics,簡稱AAP)是美国的儿科研究学会,总部位于伊利诺伊州埃尔克格罗夫村(英语:Elk Grove Village),并在华盛顿特区设有办公室。该学会由
  • 介质介质或Medium可以指:
  • H[AuClsub4/sub]氯金酸也称为四氯合金酸,是分子式为H的无机化合物。制备氯金酸时,可将金溶在王水中,再将溶液蒸发即可。加热时,氯金酸会分解为氯化氢及三氯化金,此反应是可逆反应,因此将三氯化金
  • 对流层对流层(英文:Troposphere)是地球大气层中最靠近地面的一层,也是地球大气层里密度最高的一层。它蕴含了整个大气层约75%的质量,以及几乎所有的水蒸气及气溶胶。对流层从地球表面开
  • Stockholm International Peace Research Institute斯德哥尔摩国际和平研究所(Stockholm International Peace Research Institute,SIPRI)是一个致力于研究冲突,军备,军备控制以及裁军的国际独立机构。该研究所于1966年创立。根据
  • 哈德克努特哈德克努特(Hardeknud,意为强壮的克努特;1018年-1042年6月8日),也被后世称为丹麦的克努特三世(Knud 3.)和英格兰的克努特二世(Canute II),1035年至1042年间为丹麦国王,1040至1042年间为
  • 玻璃纤维强化塑胶玻璃钢(英语:fiberglass),亦称纤维增强塑料(英语:fiber-reinforced plastic,FRP),是一种以高分子量的环氧树脂或不饱和聚酯树脂为基质,铝硼硅酸盐玻璃纤维(alumino-borosilicate glass