语音合成

✍ dations ◷ 2025-10-08 20:17:16 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 痳疯病麻风病(英语:Leprosy),又作麻疯、癞病、疠风,医学领域称为汉生病或韩森氏病(英语:Hansen's Disease),是由麻风杆菌与弥漫型麻风分枝杆菌引起的一种慢性传染病,主要经由飞沫传染但传染
  • Є寒武纪(Cambrian,符号Ꞓ)是显生宙的开始,距今约541百万年前—485.4百万年前。其名称来自于英国威尔士的一个古代地名罗马名称“Cambria”,该地的寒武纪地层被最早研究。中文名称
  • 吉尔波特症候群吉尔波特症候群(Gilbert's syndrome,简称GS)为一种常见的遗传性肝脏疾病,盛行率约3-12%。患者体内的非共轭性胆红素会显著提升,但没有明显并发症,患者可能会在运动后产生轻微黄疸
  • 1s11蒸气压主条目:氢的同位素氢是一种化学元素,其化学符号为H,原子序为1。氢的原子量为7000100794000000000♠1.00794 u,是元素周期表中最轻的元素。单原子氢(H)是宇宙中最常见的
  • 尿液尿,又称尿液,是人类和脊椎动物为了新陈代谢的需要,经由泌尿系统及尿路排出体外的液体排泄物。排出的尿液可调节机体内水和电解质的平衡以及清除代谢废物且可同时散热,尤其是退化
  • 三位一体三位一体(拉丁语:Trinitas,又译为三一真神、天主圣三、三一神、圣三一、三一神论),基督教神学术语,是基督宗教神YHWH(新教常汉译为上帝或耶和华,天主教常汉译为天主雅威)的神学理论,建
  • 质壁分离质壁分离指的是植物细胞在高渗环境下,因水分从细胞中流失而出现的细胞质与细胞壁分离的现象。细胞的渗透压可通过下式计算:π = − g ×
  • 罪惟录《罪惟录》,原名《明书》,作者查继佐,为明朝—南明史事的纪传体史书。传世唯有一部,齐鲁书社对其进行点校。查继佐于崇祯十七年(1644年)始修明史,易稿数十次,初名明书,因牵连庄廷鑨私
  • 马尔科姆二世肯尼思之子马尔科姆(中世纪盖尔语:Máel Coluim mac Cináeda;现代盖尔语:Maol Chaluim mac Choinnich,在现代英语化国王列表中被称为马尔科姆二世;954年10月5日—1034年11月25日)
  • 埃尔伍德·詹森埃尔伍德·詹森(英语:Elwood Vernon Jensen,1920年1月13日-2012年12月16日),美国医学家,辛辛那提大学医学院Vontz分子生物学研究中心乔治和伊丽莎白癌症研究主席。在2004年,他因对雌