首页 >
语音合成
✍ dations ◷ 2025-09-03 08:52:42 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 德国– æ¬§æ´²ï¼ˆç»¿è‰²åŠæ·±ç°è‰²ï¼‰â€“ 欧盟(绿色) —德æ„å¿—è”邦共和å›
- 多粘菌素多粘菌素engpolymyxin是一类多肽类抗生素,由多粘芽孢杆菌产生。由于静脉给药可致严重肾毒性(英语:Nephrotoxicity)现已少用。但现在对其肾毒性有新的认识。主要包括:多粘菌素B(po
- 毒性休克症候群毒性休克症候群(Toxic shock syndrome,TSS)是一种因细菌外毒素引起的症候群。相关症状包含发烧、红疹、皮肤脱落(英语:skin peeling),及低血压等等。其它与特定病原菌相关的症状包
- 絮状表皮癣菌Acrothecium floccosum Harz Blastotrichum floccosum (Harz) Berl. & Voglino Dactylium floccosum (Harz) Sartory絮状表皮癣菌(学名:Epidermophyton floccosum)是一种致病真
- 杜克大学杜克大学(英语:Duke University)是一所位于美国北卡罗来纳州达勒姆的一所私立男女合校研究型大学。杜克大学为美国最顶尖的学府之一,有“南方哈佛”之称(盖因在亚特兰大的埃默里
- BCR结构 / ECOD1K1F, 2AIN· protein tyrosine kinase activity · Rho guanyl-nucleotide exchange factor activity · GTPase activator activity · protein binding
- 艾宾浩斯赫尔曼·艾宾豪斯(德语:Hermann Ebbinghaus 1850年1月24日-1909年2月26日),是德国心理学家。他是第一个描述学习曲线的人,他开创了记忆的实验研究,并以发现遗忘曲线和间距效应而闻
- 量子计算机量子计算机(英语:Quantum computer)是一种使用量子逻辑进行通用计算的设备。不同于电子计算机(或称传统计算机),量子计算用来存储数据的对象是量子比特,它使用量子算法来进行数据操
- 太阳中微子缺失问题太阳中微子问题是测量到穿过地球的太阳中微子流量与理论计算相比出现缺失的问题,从1960年代中期持续至约2002年。这种缺失已经被中微子物理的新的认识解决了,这要求对粒子物理
- 川烫汆(拼音:cuān;注音:ㄘㄨㄢ)是烹饪时对食材的一种处理方法,又称汆烫、川烫、焯水或飞水。较常用的一个意思是指把食材放入沸水中片刻,透过水的热力烧煮食材。可以达到去除肉类血水