首页 >
语音合成
✍ dations ◷ 2025-11-26 13:31:27 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 鸦片类药物阿片类药物(Opioid)是具有吗啡作用的化学物质,主要用途是镇痛。阿片类药物通过存在于中枢神经系统和消化系统的阿片类受体(Opioid receptor)起作用。这些阿片类受体能引发有益的
- 血球凝集素血球凝集素(hemagglutinin)(C53H67N9O17) (TYR-PRO-TYR-ASP-VAL-PRO-ASP-TYR-ALA),是指可使红血球凝集的抗体或其他物质。在流感病毒、痳疹病毒(以及许多其他细菌和病毒)表面等均
- 2016年联合国秘书长选举2016年联合国秘书长选举旨在选出新一任联合国秘书长,以接替于2016年12月31日卸任的秘书长潘基文。在此前的联合国秘书长选举过程中,候选人名单由安理会闭会讨论选出。同时,传统
- 子宫肉瘤子宫肉瘤(英语:uterine sarcoma),是一类子宫的平滑肌或结缔组织病变引起的一种恶性转移性肿瘤。它的子类包括有平滑肌肉瘤、子宫内膜间质肉瘤(英语:endometrial stromal sarcomas)
- 植皮植皮(Skin grafting)是一种专门移植皮肤的移植技术。通常用来治疗外伤、烧伤、感染或某些手术造成的伤口。植皮主要有两个目的,第一是能够减少治疗所需程序,第二是增进身体的外
- 摩门教耶稣基督后期圣徒教会文化上相近的几个后期圣徒运动宗派,其最大的宗派为耶稣基督后期圣徒教会。耶稣基督后期圣徒教会也常被用来描述这个相信《摩尔门经》的信仰系统。该派别
- 苏打粉96 g/L (20 °C) 165 g/L (60 °C) 236 g/L (100 °C)碳酸氢钠(sodium bicarbonate、IUPAC名: sodium hydrogen carbonate、baking soda)是一种无机化合物,化学式为NaHCO3,俗称
- 温德尔·斯坦利温德尔·梅雷迪思·斯坦利(英语:Wendell Meredith Stanley,1904年8月16日-1971年6月15日),出生于印第安纳州里奇维尔,美国化学家,1946年获诺贝尔化学奖。1901年:范托夫 | 1902年:费歇
- Nsub2/subHsub2/sub二氮烯或二亚胺(Diimine/Diazene,HN=NH)是烯烃(包括多烯)和炔烃的氢化试剂。氢化是顺式加成,两个氢从一面加到不饱和键上,与金属催化的氢化反应选择性类似,因此该法适用于某些不适合
- 铅玻璃铅玻璃是玻璃的一种,与一般碳酸钾玻璃最大的不同为其中的钙被铅取代。铅玻璃通常含有18至40%氧化铅 (PbO),不过现代的铅水晶 (lead crystal,又因其氧化硅起源而被称为燧石玻璃)
