首页 >
语音合成
✍ dations ◷ 2025-11-28 17:48:59 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 配体配体(ligand,也称为配基、配位基、牙基)是一个化学名词,表示可和中心原子(金属或类金属)产生键结的原子、分子和离子。一般而言,配体在参与键结时至少会提供一个电子。配体扮演路易
- 孢子丝菌病孢子丝菌病是一种因为受到申克氏孢子丝菌(Sporothrix schenckii)感染,引起皮肤产生病变,也可能发生在肺、关节、骨骼,甚至脑,但是较为罕见。申克氏胞子丝菌存在于土壤中,干草堆、
- 壬二酸壬二酸是一种饱和二羧酸,化学式为HOOC(CH2)7COOH。在标准状态下,纯壬二酸呈白色粉末状。壬二酸自然存在于小麦、黑麦和大麦等榖物中。壬二酸可作为聚合物和增塑剂等化工产品的
- 急症护理重症医学(Intensive care medicine )是医学中的一个分支,诊断及管理会危及生命的疾病或是情形,会需要器官支持(英语:Organ support)及侵入性监测设备。在重症监护室中常见的设备有
- 玻色-爱因斯坦凝聚玻色–爱因斯坦凝聚(Bose–Einstein condensate)是玻色子原子在冷却到接近绝对零度所呈现出的一种气态的、超流性的物质状态(物态)。1995年,麻省理工学院的沃夫冈·凯特利与科罗
- 机器人航天器机器人太空船,意即港台媒体所指的无人探测器,具有对天体研究、观测等自动化完成的功能,主要指行星探测器、行星着陆探测器等具有机器人特性的无人飞船,不包括阿波罗4号这样的载
- Gmelin盖墨林数据库是一个收录无机化学和金属有机化学化合物和反应的化学数据库。它的前身是德国化学家利奥波德·盖墨林(Leopold Gmelin)于1817年编撰的《盖墨林无机化学手册》(Gmel
- 蜥结龙蜥结龙属(属名:Sauropelta,意为“蜥蜴的甲盾”)又名楯甲龙、蜥肋螈,是结节龙科恐龙的一属,生存于早白垩纪的北美洲。目前已有一个已命名种,爱氏蜥结龙(S. edwardsorum),但可能有其他种
- 加州红木加州红木(学名:Sequoia sempervirens),又称海岸红杉、红杉、北美红杉、美国红杉、长叶世界爷、咖斗,是世界上最高的针叶树(位于第二高花旗松的变种海滨黄杉以及第三高的北美云杉之
- 雅典娜雅典娜(现代希腊语:Αθηνά、拉丁语:Athena、阿提卡方言:Ἀθηνᾶ或Ἀθηναία、伊俄尼亚方言:Ἀθήνη或Ἀθηναίη(多用于史诗)丶埃俄利亚方言:Ἀθήναα丶多里
