首页 >
语音合成
✍ dations ◷ 2025-11-23 11:20:24 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- AAT艺术与建筑索引典(英语:Art & Architecture Thesaurus,AAT)是一个用来描述关于艺术、建筑和物质文化项目的受控词表。AAT收录各种通用术语,如“大教堂”,但不收录专有名词,如“圣母
- 酒精搓手液酒精搓手液,又名搓手液、免冲水洗手液、免洗洗手液等,是一种用作洗手的液体。酒精搓手液的主要成分为酒精,用作杀菌。由于酒精搓手液无需用水冲洗,所以可以用于外出时清洁双手之
- 陶片放逐制陶片放逐制(希腊文:ὄστρακον;英文:Ostracism),又译陶片流放制、陶片放逐法、陶片流放法或贝壳流放法等,是古代雅典城邦的一项政治制度,由雅典政治家克里斯提尼于前510年创立
- 格式塔学派异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 演化心理学 实验心理学
- β-羟丁酸β-羟基丁酸(β-hydroxybutyrate),又称3-羟基丁酸,化学式: CH3CH(OH)CH2CO2H,是一种羟基酸。β-羟基丁酸具手性,有两种对映异构物:D-3-羟基丁酸和L-3-羟基丁酸。此化合物在人体饥饿
- 旧石器时代旧石器时代(英语:Paleolithic age)是石器时代的早期阶段,一般划定此时期为距今约260万年或250万年(能人首次制造出石器)至1.2万年前(农业文明的出现)。地质时代属于上新世晚期至更新
- 五氧化二氮五氧化二氮(化学式:N2O5),又称硝酐,是硝酸的酸酐。通常状态下呈无色柱状结晶体,易溶于水,水溶液呈酸性。可以用P2O5将浓HNO3脱水得到。五氧化二氮很容易潮解,而且在10℃以上能分解生
- 鱼眼镜头鱼眼镜头指视角接近或等于180°的镜头,视角为众多镜头之冠。这类镜头一般焦距极短,在135底片格式下,16毫米或焦距更短的镜头通常即可认为是鱼眼镜头,绝大部分的鱼眼镜头均是定焦
- 佩勒姆亨利·佩勒姆(Henry Pelham,1694年9月25日-1754年3月6日),英国辉格党政治家,曾任首相(1743年8月27日 - 1754年3月6日),任内逝世。继任人为其长兄纽卡素公爵。亨利·佩勒姆,佩勒姆男爵
- 杰弗里·弗里德曼杰弗里·M·弗里德曼(英语:Jeffrey M. Friedman,1954年7月20日-),美国医学家,纽约市洛克菲勒大学的分子遗传学家,和霍华德·休斯医学研究所的研究员。他发现了激素瘦素和它对调节人
