语音合成

✍ dations ◷ 2025-12-09 21:16:39 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 语义网络语义网络(英语:Semantic Network)常常用作知识表示的一种形式。它其实是一种有向图;其中,顶点代表的是概念,而边则表示的是这些概念之间的语义关系。语义网络是机读型字典(machine-
  • 演化支演化支是一个分类学的类别,包含着单一的共同祖先及其所有后裔。任何一个演化支都可以说是一个单系群,并以种系发生学的树状图或支序分类学的演化树来表示。若一个演化支在不同
  • 鲑鱼鲑鱼(英语:salmon),其中大西洋鲑又音译为三文鱼,是数种鲑科鱼的通称。它们大部分为洄游性辐鳍鱼,是常见的可食用鱼类之一。共有300多个属种的鲑科鱼类生活在大西洋及太平洋,在非原
  • 固绿FCFFood green 3, FD&C Green No. 3, Green 1724, Solid Green FCF, C.I. 42053固绿FCF是一种海绿色的三芳基甲烷食用色素。固绿FCF可以作为马松三色染色法(Masson's trichrome
  • 符码在符号学中,符码(code)是用于沟通意义的一套惯例。最常见的符码是口语语言,但此术语还可用来指任何叙事的形式:例如色彩的意象(红色代表危险)、游戏规则(国际象棋中军事的能指)。索绪
  • 老年痴呆阿尔茨海默病(拉丁语:Morbus Alzheimer、德语:Alzheimer-Krankheit、英语:Alzheimer's disease,缩写:AD),俗称早老性痴呆、老年痴呆,是一种发病进程缓慢、随着时间不断恶化的神经退化
  • 交叉学科科际整合(英:Interdisciplinarity),或译交叉学科、学科间研究,指的是两个或多个学科相互合作,在同一个目标下进行的学术活动。科际整合的项目通常源于对单一学科无法、或是无意
  • 酪氨酸激酶抑制剂酪氨酸激酶抑制剂(Tyrosine kinase inhibitor,TKI)是能阻断酪氨酸激酶的药物。由于酪氨酸激酶在细胞内担任许多讯号传递的开关,因此该酶的突变常常引起癌症;酪氨酸激酶抑制剂因此
  • 莫利纳何塞·马里奥·莫利纳-帕斯奎尔·恩里克斯(José Mario Molina-Pasquel Henríquez,1943年3月19日-)生于墨西哥墨西哥城,化学家,是发现南极臭氧洞的主要人物之一。他成功解释了氯氟
  • 巴黎市政厅巴黎市政厅(法语:Hôtel de Ville)是法国巴黎自1357年以来的市政厅所在地,位于第四区的市政厅广场(在1802年以前名为“格列夫广场”,Place de Grève,意为河滩广场)。它具有多种功能