首页 >
语音合成
✍ dations ◷ 2025-12-10 12:55:14 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 红斑狼疮症红斑狼疮(Lupus erythematosus)为一系列自体免疫性疾病的统称,即免疫系统非正常地攻击自身正常组织。症状可能会发生于全身各处,包含关节、皮肤、肾、血球、心脏,以及肺。最常见
- 忧郁型抑郁障碍忧郁型抑郁障碍,表现为患者对绝大多数或者所有活动失去兴趣,对于愉快的刺激失去反应,抑郁心境且比丧恸或失去亲人更严重,在早上情况更差,早醒,精神运动性阻滞,体重迅速降低(注意与神
- 普世主义普世主义是哲学上的一个分支,它强调普遍的事实能够被发现且被理解。在伦理上,普世性就是指能够应用在所有人身上的价值观或事物。这种思想存在于许多宗教或哲学体系之中。普世
- real-time RT-PCR即时聚合酶链式反应(英语:Real-time polymerase chain reaction)是一种在DNA扩增反应中,以萤光染剂侦测每次聚合酶链锁反应(PCR)循环后产物总量的方法。此实验法已被众多科学家采
- 奇性定理彭罗斯-霍金奇点定理(英语:Penrose-Hawking singularity theorems)是关于广义相对论中何时产生引力奇点的问题的一些研究结果。爱因斯坦场方程解的奇点是指下面两个问题类空奇点
- 哈伯太空望远镜哈勃空间望远镜(英语:Hubble Space Telescope,HST),是以天文学家爱德温·哈勃为名,在地球轨道的望远镜。哈勃望远镜接收地面控制中心(美国马里兰州的霍普金斯大学内)的指令并将各种
- 安全术语安全建议标准词(英语:Safety phrases,简写:S-phrases)是于《欧盟指导标准67/548/EEC 附录Ⅳ: 有关危险物品与其储备的安全建议》里定义。该列表被集中并再出版于指导标准2001/59/
- 死亡之手死亡之手是冷战时期苏联的一套核武器操控设备。它包括一套计算机系统,通过检测地震波、放射线等数据判定苏联是否已经遭到核攻击,如判定遭到攻击,系统会发射特别的“广播导弹”
- 海螺疱疹病毒属海螺疱疹病毒属(学名:Aurivirus)是疱疹病毒目软体动物疱疹病毒科的一个属,为该科的两个属之一,以鲍鱼为宿主。本属仅有一种病毒,即海螺疱疹病毒1型(Haliotid herpesvirus 1),又称鲍鱼
- 甲醇经济甲醇经济(英语:methanol economy)是一种提议中未来的经济形式,使用甲醇来代替现在广泛使用的化石燃料来用作能量存储,地面交通燃料,以及合成碳氢化合物的原料及其产品。它与提议中
