语音合成

✍ dations ◷ 2025-08-13 19:33:47 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 给药途径给药途径,又称用药途径,药理学和毒理学上指药物和人体接触作用的途径。给药途径通过人体自身的运输和代谢过程,强烈影响着各种药物在体内的效用。上述不是按给药部位,而是按给药
  • 模因学模因学(或模因论)是一种基于类比达尔文进化论的视角来研究心智内容的学说,源自于理查德·道金斯于1976年出版的《自私的基因》一书。模因论旨探索文化信息传播的社会演化模型。
  • 印度教唯心主义唯心论(英语:idealism)或唯心主义、理想主义、理念论或观念论,在哲学中是一个提出心灵是基本之存在的哲学理论。唯心论直接相对于唯物论,后者认为世界的基本成分为物质,我们对世界
  • 毫米(法语:millimètre;英式英文:millimetre,美式英文:millimeter),符号mm,是长度单位单位,台湾称为“公釐”、“公厘”或“毫米”,中国大陆称为毫米。1毫米相当于千分之一米(10-3,此即为
  • 亅部,为汉字索引里为部首之一,康熙字典214个部首中的第六个(一划的则为第六个)。就繁体中文中,亅部归于一划部首,而在简体字部首中,“亅部”并入“丨部”,视为“丨部”的附形部首。
  • 夂部,为汉字索引里为部首之一,康熙字典214个部首中的第三十四个(三划的则为第五个)。夂部通常是从上方为部字,且无其他部首可用者将部首归为夂部。要注意的是,在传统汉字中,夂部与
  • 难熔金属难熔金属是指特别耐热不易熔化,并且具有耐磨(英语:Wear)性的金属。此术语主要是用在材料科学、和冶金工程。这些元素在不同领域中的的定义方式有些不同。最常见的定义方式包括五
  • 变钩车轮虫属车轮虫齿体由齿钩、齿锥和齿棘组成,显著的特点是齿钩形状多样,变化多端,齿棘向后弯曲约90-140度。口围度140-180度。代表动物是Heterobladetrichodina punctatus Hu, 2011 (斑
  • 脸部移植脸部移植,指通过医学手段置换部分或全部脸部的手术。全球首例部分脸部移植于2005年在法国实施。首例全脸移植则于2010年在西班牙完成。
  • 全球第四十一位索引 国防预算 石油储量 军事(武装部队) 死刑 国债 生育率 最高点 官方语言 地理 政体 面积 代码 陆地面积 人口 人口密度 国内生产总值 国徽 国旗 国歌 国家格言 首都 城市