首页 >
语音合成
✍ dations ◷ 2025-10-19 13:09:10 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 人祭人祭(英语:human sacrifice)是一种古代宗教仪式(祭祀),即用人作为祭品来祭祀神灵,与它相似的仪式有动物祭(英语:Animal sacrifice)。在整个人类史上,各种文明均发生过用活人作为牲礼的
- 综合语综合语(Synthetic language)是一个语言学的概念,与分析语(孤立语)相对。在语言类型学中,一个有着高的语素词语比(英语:morpheme-per-word ratio)的语言。类似德语、俄语等的印欧语言
- 化妆化妆是美容的手段之一,可以使人更有自信或者看起来更具有亲和力。化妆广泛存在于人类社会和文化当中,几乎是普世文化通则的一部分。一般来说,人们会根据工作需要和场合作相应的
- 演化语言学演化语言学,是对人类原始语言的发展,及其社会行为演化的科学。由于语言的声音转眼即逝,令到这学科研究欠缺原始资料。因此过去百多年,这学科都难以发展。由19世界80年代后期起,这
- 高似兰高似兰(英文名菲力浦·伯鲁涅列斯基·高似兰,Philip Brunelleschi Cousland,1860年-1930年),苏格兰传教士医生。高似兰编撰的英汉对照《医学辞汇 Lexicon of Medical Terms》是中
- 种族隔离种族隔离(英文:Racial segregation),指在日常生活中,按照不同种族将人群分割开来,使得各种族不能同时使用公共空间或者服务。种族隔离可能是法律规定的,也可能是无法律规定但事实存
- 75号州际公路75号州际公路(Interstate 75,简称I-75)是美国州际公路系统的一部分。南端在佛罗里达州海厄利亚(迈阿密近郊)与826号佛州州道和924号佛州州道交汇,北至密歇根州苏圣玛丽(经苏圣玛丽
- 希农城堡希农城堡(法语:Forteresse royale de Chinon 或 Château de Chinon)位于法国的安德尔-卢瓦尔省。希依城堡由卢瓦尔王朝的布洛瓦伯爵西奥博尔德一世于945年兴建,于12世纪时,则被
- 载人热气球热气球(英语:balloon)是娱乐性航空器的一种,它配备有用来填充气体的袋状物,当充入气体的密度小于其周围的环境的气体密度,且由此压力差产生的静浮力大于气球本身与其搭载物的重量
- iUniversity of Chicago Press芝加哥大学出版社(University of Chicago Press)是位于芝加哥大学中途公园的一个出版社,由芝加哥大学运营,成立于1890年,现为美国最大最古老的大学出版社之一。除去各种书籍和期