语音合成

✍ dations ◷ 2025-04-02 18:18:46 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 封套封套(法语:enveloppe,英语:envelope,葡萄牙语:envelope,德语:Umschlag,西班牙语:sobre),是一种包装工具,通常都是压平的。制造信封的材料有很多种,最常见的是纸张,其次还有纸版、塑胶、牛皮
  • 内出血内出血(Apoplexy)是指在器官内部的出血以及其伴随的症状,例如卵巢内出血(英语:Ovarian apoplexy)是指卵巢中出血的症状。Apoplexy一词以前曾用来表示中风。不过现代一般会区分内出
  • 屈折变化在语法学中,词形变化(又译作形态变化、屈折变化)(Inflection or inflexion)指单词(或词根)的变化,以导致语法功能改变,进而使其代表的意义也有所改变。印欧语屈折变化又可以分为变位
  • 足底足底筋膜炎(英语:Plantar fasciitis),又称跑者足(英语:jogger's heel),是一种发生在支撑足弓的结缔组织著骨点(肌腱和韧带附着于骨头处)病变。患者会有脚跟或脚底疼痛,每天起床或是休息
  • 太极太极是中国思想史上的重要概念,主要继承自《周易》:“易有大恒,是生两檥。两檥生四马,四马生八卦。”(马王堆出土本),故改“恒”为“极”,而四马同时改为四象。“太”与“大”古时相
  • 大地测量学大地测量学是在一定的时间与空间参考系中,测量和描绘地球形状及其重力场并监测其变化,为人类活动提供地球空间信息的一门学科,属于地球科学的一个分支,也是一切测绘科学技术的基
  • 加尔省加尔省(法语:Gard)是法国的朗格多克-鲁西永-南部-比利牛斯大区所辖的省份,南邻地中海。该省编号为30。5个海外省及大区
  • 成田市成田市(日语:成田市/なりたし Narita shi */?)是位于日本千叶县北部的城市。境内有成田国际机场,门前町成田山新胜寺是成田市最早发展的地区,本市也因此而繁荣。人口约10万人。
  • 量子穿隧效应在量子力学里,量子隧穿效应(Quantum tunnelling effect)指的是,像电子等微观粒子能够穿入或穿越位势垒的量子行为,尽管位势垒的高度大于粒子的总能量。在经典力学里,这是不可能发
  • 材料热力学材料热力学(Thermodynamics of Materials)是热力学在材料科学中的应用。材料热力学的核心在于透过相图来解释纯物质或合金的相变化以及溶液中各成分所表达的热力学性质,藉以分