首页 >
语音合成
✍ dations ◷ 2025-11-29 14:49:51 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- T细胞T细胞(英语:T cell、T lymphocyte)是淋巴细胞的一种,在免疫反应中扮演着重要的角色。T是胸腺(thymus)而不是甲状腺(thyroid)的英文缩写。T细胞在骨髓被制造出来之后,在胸腺内进行“新
- 放射虫门放射虫门(学名:Radiozoa)又名放线虫,为海中浮游生物,有如球形对称,带有硅壳,壳上有美丽的花纹。身体内有膜质中央囊,囊面穿有许多小孔,将身体分为内外两部分,外部被胶状物质,多有液泡,内
- 吉姆·克拉克詹姆斯·亨利·克拉克(英语:James Henry Clark,1944年3月23日-)是美国企业家和计算机科学家。他创立了几家著名的硅谷科技公司,包括Silicon Graphics、Netscape、myCFO和Healtheon
- 细胞表面抗原分化簇 (也被称为分化群 或简称为 CD) 指的是用来辨识那些用作免疫抗原辨识的细胞表面分子。 在生理学上,CD分子有许多用途,通常用作细胞的重要受体或配体。 CD可用于细胞的讯
- 迪斯科迪斯科(英文:Disco),来自法文的discothèque,意指那些播放录制好的跳舞音乐的舞厅,来源于美国黑人民间舞蹈和爵士舞。近几年在世界,特别是欧洲风靡一时的伴舞音乐,节奏是混合了爵士
- 圣十字圣殿佛罗伦萨圣十字圣殿(意大利语:Basilica di Santa Croce)是方济各会在意大利佛罗伦萨的主要教堂,罗马天主教的一座次级圣殿,坐落在主教座堂东南方大约800米的圣十字广场。这个地点
- 所罗门·斯奈德所罗门·哈尔伯特·斯奈德(英语:Solomon Halbert Snyder,1938年12月26日-),美国神经学家,生于华盛顿。斯奈德毕业于乔治城大学,现在是约翰斯·霍普金斯大学医学院的精神病学、神经科
- 材料材料是人类可以利用制作有用构件、器件或物品的物质。材料的发展标志着社会的进步,比如石器的广泛使用是“石器时代”,相似的还有“青铜时代”和“铁器时代”等等。材料和资讯
- 邪恶轴心“邪恶轴心”(英语:Axis of evil)是美国总统乔治·沃克·布什于2002年1月在他的国情咨文中所发表的看法,意指“赞助恐怖主义的政权”;其中明确指出的国家包括伊朗、伊拉克(萨达姆
- 希沙姆·格鲁杰希沙姆·格鲁杰(摩洛哥阿拉伯语:هشام الكروج,柏柏语:Hicam El Gerruj,ⵀⵉⵛⴰⵎ ⴻⵍ ⴳⴻⵔⵔⵓⵊ,1974年9月14日-),摩洛哥田径运动员,擅长中距离,目前为1500米(3分26秒00
