首页 >
语音合成
✍ dations ◷ 2025-11-22 14:57:24 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 原杉藻原杉藻(学名:Prototaxites)为一属陆生的真菌,生存于志留纪晚期至泥盆纪晚期(4亿3千万年前 - 3亿6千万年前),其子实体形成类似树干的结构,直径达1米(3英尺),高度则可达8.8米(29英尺),由直径
- 趋同演化在演化生物学中,趋同演化(英语:Convergent evolution)指的是两种不具近缘关系的生物长期生活在相同或相似的环境(或曰生态系统)中,因应需要而发展出相同功能的器官(即同功器官)的现象
- 硫酸钡0.000285 g/100 mL (30 °C)硫酸钡,也称作钡白,是一种白色结晶固体,化学式为BaSO4,几乎不溶于水和其他传统溶剂,溶于浓硫酸。重晶石的主要成分是硫酸钡,是常见的钡矿石。硫酸钡是
- 泼尼卡酯泼尼卡酯是一种新型外用药物,属于皮质类固醇,其药效与皮质醇类似。和其他局部用皮质类固醇(如倍他米松)相比,重复使用泼尼卡酯不会很快导致皮肤萎缩。皮质类固醇向来是治疗皮肤病
- 动物行为学动物学人类学 · 人与动物关系学 蜜蜂学 · 节肢动物学 医学节肢动物学 · 鲸类学 贝类学 · 昆虫学 动物行为学 · 蠕虫学 两栖爬行动物学 · 鱼类学 软体动物学 · 哺乳动
- 1,1,1-三氯乙烷1,1,1-三氯乙烷是一种卤代烃(化学式:CH3CCl3或C2H3Cl3),是一种广泛应用的工业溶剂。其别名包括甲基氯仿及chlorothene,其商品名被称为溶剂 111及Genklene(帝国化学工业公司使用)。
- 黑店狂想曲《肉食店》(法语:Delicatessen)由马克·卡罗及尚-皮尔·桑里导演,是1991年法国黑色喜剧电影。故事背景设定在第二次世界大战后,经济萧条、物资困顿年代,影片讲述城市边区的一家肉
- 阿瑟·霍里奇阿瑟·L·霍里奇(英语:Arthur L. Horwich,1951年-),美国生物学家,在耶鲁大学医学院工作,并且自1990年至今一直在霍华德·休斯医学研究所做研究工作。研究领域主要是蛋白质折叠和分子
- 乙基乙基是一个烃基官能团,化学式为—C2H5,简写为—Et(Ethyl)。最简单的乙基化合物为乙烷(C2H6),乙基与氢原子相连。其他包括氯乙烷、溴乙烷、乙醇、乙胺和硝基乙烷等。乙基化指向分子
- 善普施撒马利亚救援会(Samaritan's Purse),或译普善施,是一个总部位于美国北卡罗来纳州布恩的基督教福音派国际慈善机构。现任会长是葛福临。该组织的名称来自《新约》中好撒马利亚人
