语音合成

✍ dations ◷ 2025-11-08 02:32:57 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 马塞诸塞州马è¨è¯¸å¡å·ï¼ˆè‹±è¯­ï¼šCommonwealth of Massachusetts),简称麻çœã€éº»å·ï¼Œæ­£å¼å称为é©
  • 深层生态学深层生态学一词由挪威哲学家阿恩·内斯(Arne Næss)在1973年于一场第三世界未来发展研讨会中提出。后经德韦尔(BillDeval)、塞申斯(GeorgeSessions)、福克斯等人的努力而发展
  • 米兰多拉乔瓦尼·皮科,米兰多拉领主及康科迪亚伯爵 (Giovanni Pico dei conti della Mirandola e della Concordia,1463年2月24日-1494年11月17日),通称乔瓦尼·皮科·德拉·米兰多拉, 意大
  • 语言灭亡语言灭亡(英语:language death、language extinction、linguistic extinction、linguicide、glottophagy)是一个影响语言社群的过程。这现象显示某项语言变体的讲者族群,相关之
  • 神经脊神经脊(英语:neural crest)属于动物胚胎的外胚层,位于神经管(neural tube)与胚胎上皮之间。神经脊细胞在神经板形成(neurulation)之后不久就会离开原来所在位置。
  • 痛觉身体的疼痛(pain)指通常由身体损伤、病患或不良的外部刺激所引起的不舒服感觉。出于临床研究的需要,国际疼痛研究国际疼痛研究协会(英语:International Association for the Stud
  • 铁丝网有刺铁丝网(barbed wire),是一种防御型的金属丝,身上布满尖锐的刃口,刃与刃之间亦有相同的距离。这类丝网价格低廉,用来保护墙内的财产,并是第一次世界大战里堑壕战的重要防守设备
  • 糖精糖精(Saccharin),学名邻苯甲酰磺酰亚胺,是一种不含有热量的甜味剂。1879年由美国约翰霍普金斯大学化学家Constantin Fahlberg发现。为白色结晶性粉末,难溶于水,对热安定与否仍存在
  • 成田市成田市(日语:成田市/なりたし Narita shi */?)是位于日本千叶县北部的城市。境内有成田国际机场,门前町成田山新胜寺是成田市最早发展的地区,本市也因此而繁荣。人口约10万人。
  • 乙烯基乙烯基(Vinyl group)是结构式为-CH=CH2的有机基团。含乙烯基的化合物是乙烯(CH2=CH2)中的一个氢原子被其他基团取代而形成的衍生物。一个相关的基团是亚乙烯基或乙烯叉,是乙烯中