语音合成

✍ dations ◷ 2025-11-23 17:37:12 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 亚伊采坐标:44°20′24.91″N 17°15′26.04″E / 44.3402528°N 17.2572333°E / 44.3402528; 17.2572333亚伊采(波斯尼亚语:Jajce、克罗地亚语:Jajce、塞尔维亚语:Јајце)是波斯尼
  • 超声造影成像超声造影成像是超声造影剂在传统超声成像中的应用。超声造影剂靠声波在不同介质的交界面反射的方式不同来增强对比。这种交界面可以是小气泡的表面,或者其它更加复杂的结构。
  • 认知革命认知革命为一场始于20世纪50年代的知识运动,对思维及其过程进行跨学科的研究。后来被统称为认知科学。相互交流的相关领域有心理学、人类学、语言学。认知革命使用了当时新兴
  • 间脑间脑(diencephalon)位于端脑与中脑之间,大部分被大脑两侧半球所遮盖,间脑呈楔形,下部与中脑相连。间脑主要分为丘脑和下丘脑,细分可分为背侧丘脑、上丘脑、后丘脑、下丘脑和底丘脑
  • 科莫湖科莫湖(意大利语:Lago di Como),意大利阿尔卑斯山脉一冰蚀湖,著名旅游胜地,属伦巴第大区管辖,面积146平方公里,为意大利第三大湖。列尔纳城堡列尔纳瓦伦纳
  • 阿马尔菲海岸阿马尔菲海岸(意大利语:Costiera Amalfitana)是意大利南部萨莱诺省索伦托半岛南侧的一段海岸线,西面到波西塔诺,东面到海上萨莱诺。沿着阿马尔菲海岸的城镇有萨莱诺、滨海维耶特
  • 罗伯特·莱夫科维茨罗伯特·莱夫科维茨(英语:Robert Lefkowitz,1943年4月15日-)是一位美国医学家,最出名的工作是关于G蛋白偶联受体,为此他赢得了2012年诺贝尔化学奖。他与布莱恩·科比尔卡分享这个奖
  • 电解质失衡电解质在生物体的自平衡维持上相当的重要。电解质可调节心臓及神经机能、输送氧气、维持体液平衡(英语:fluid balance)及酸碱平衡等。电解质的不平衡可能因为以下原因而产生:过
  • 北高加索联邦管区北高加索联邦管区(俄语:Се́веро-Кавка́зский федера́льный о́круг,罗马化:Severo-Kavkazsky federalny okrug),位于俄罗斯西南部的北高加索
  • 生物聚合物生物聚合物(英语:Biopolymer,又称为生物聚合体、生物多聚体或生物高分子)是由活的生物体产生的聚合物。因为他们是聚合物,生物聚合物包含有单体单元,相互之间以共价键相连以形成更