语音合成

✍ dations ◷ 2025-11-18 09:41:49 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 盘古大陆泛大陆(英语:Pangaea 或 Pangea),又称“超大陆”、“盘古大陆”,原文为希腊语 Παγγαία,是 πᾶν(全部)和 γαῖα(陆地;盖娅,大地女神)的合字,即“全陆地”。泛大陆是指在古生代
  • 弥赛亚弥赛亚(天主教汉译作默西亚;希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Ara
  • 书籍的右页和左页书籍的右页是书籍右侧的页面, 也称作纸张的正面;左页是书籍的左侧部分的页面, 也称作纸张的反面。它们是装订, 打印和出版业中的术语, 并且可以更广泛地应用在实体文件交流的
  • 伊朗语波斯语(فارسی / Fârsî‎),中文也称波斯文,属于印欧语系印度-伊朗语族伊朗语支,是一种形成于8至9世纪间的文学语言。是今天伊朗的官方语言,作为其分支的达利语和塔吉克语
  • C01A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码C01(心脏病治疗药)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collab
  • 有颌下门有颔下门(Gnathostomata)原为有颔总纲(Gnatha),是脊椎动物亚门中拥有颔的一群,与无颔总纲相对应,属于较高等的一类。有颔下门生物之下颌骨系于距今约四亿三千万年前开始发展形成,即
  • 香油香油,广义的香油指烹调中用于增加食料香味的食用油,包括芝麻油、豆瓣油、花椒油、红油、葱油、蒜香油、芥末油、橄榄油、南瓜油、猪油、鸡油、虾油、黄油等,狭义的香油指芝麻油
  • 奄蔡奄蔡(上古汉语拟音:;英语:Alans,或 Alani,也拼为 Alauni 或 Halani)为古代中亚印欧语系游牧民族,又作阖苏,1—3世纪中叶的 东汉三国时期也称阿兰聊(中古汉语拟音:)或阿兰。他们族源是塞
  • 泰德·透纳泰德·透纳(英语:Ted Turner,1938年11月19日-),美国新闻人,世界第一个电视新闻频道有线电视新闻网的创办者。于24岁继承其自杀父亲的遗产,并于1970年购买了亚特兰大的一家电视台,创办
  • 酚类在有机化学中,酚类化合物(英语:phenol)是一类通式为ArOH,结构为芳烃环上的氢被羟基(—OH)取代的一类芳香族化合物。酚类化合物中最简单的酚为苯酚(C6H5OH,亦称石炭酸)。虽然结构与醇类