语音合成

✍ dations ◷ 2024-07-08 12:34:09 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 第三阶段临床试验(英语:Clinical trial)是一种根据研究方案利用已上市药物或安慰剂作为对照组的方式,对药物或其他医学治疗在受试者身上进行比较测试的过程。在临床试验中,研究者要先决定
  • 中阳虫门Raphidiophryidae Acanthocystidae Heterophryidae中阳虫门(Centrohelid或Centroheliozoa)是一类原生生物,包括一些固着生活和游动生活的类群,在淡水与海水中都有发现,但主要生活
  • 东非东非即东部非洲地区,根据联合国的次分区共有19个国家或属地:亚洲东亚 · 东南亚 · 南亚 · 中亚 · 西亚/西南亚 · 北亚/西伯利亚  · 东北亚 其他:近东 · 中东
  • 椭圆在数学中,椭圆是平面上到两个相异固定点的距离之和为常数的点之轨迹。根据该定义,可以用手绘椭圆:先准备一条线,将这条线的两端各绑在固定的点上(这两个点就当作是椭圆的两个焦点
  • 系统发育树系统发生树(英语:phylogenetic tree)又称演化树或进化树(evolutionary tree),是表明被认为具有共同祖先的各物种间演化关系的树状图。是一种亲缘分支分类方法(cladogram)。在图中,每
  • 过去式过去时(Past tense),也常称为过去式,是一种时态,用于说话时点之前所发生事件的语法意义。在英语中,过去时态是一个动词的词尾变化的形式之一。规则动词的过去式是由基本形式的动词
  • 埃尼石油集团埃尼,全称为国家碳化氢公司(Eni,Ente nazionale ldrocarburi),是意大利政府成立的国家控股公司,专门经营石油产品,是世界第七大石油集团公司之一,也是在世界大炼油公司中排第8位。埃
  • 梅肯市梅肯(英语:Macon /ˈmeɪkən/),正式名称梅肯-比伯县(Macon–Bibb County),位于美国佐治亚州首府亚特兰大市东南约81英里(约130公里)处,人口约15万,是该州第五大城市、工业重镇,其传统产
  • 火山所有坐标的地图 - OSM 所有坐标的地图 - Google 所有上至200个坐标的地图 - Bing本列表列出希腊的活火山与死火山。爱琴文明 · 迈锡尼时期 · 黑暗时期 · 古风时期 ·
  • 三对角在线性代数中,一个三对角矩阵是矩阵的一种,它“几乎”是一个对角矩阵。准确来说:一个三对角矩阵的非零系数在主对角线上,或比主对角线低一行的对角线上,或比主对角线高一行的对角