首页 >
语音合成
✍ dations ◷ 2025-06-07 17:55:45 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。
1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。
相关
- 技术技术可以指人类对机器、硬件或人造器皿的运用,但它也可以包含更广的架构,如系统、组织方法学和技巧。它是知识进化的主体,由社会形塑或形塑社会。如电脑等新技术的增生使人们相
- 在科学领域的扩张学术出版(英语:academic publishing)是出版业的一个分支,范围涵盖学术研究领域。大多数学术成果都以期刊论文、书籍等形式被出版。大多数科学技术方面的期刊、书籍,都需要经过同
- 血管新生血管新生(英文:Angiogenesis)是一个生理上新的微血管发展成一个血流供应系统的过程。而Vasculogenesis通常指自发性的血管形成,另外Intussusception则是指较一般快速形成的血管
- 差示扫描量热计差示扫描量热法(英语:Differential scanning calorimetry,简称DSC)是一种热分析技术,借助补偿器测量使样品与参比物达到同样温度所需的加热速率与温度的关系。1962年E.S.沃森和M.
- 脂质粒脂质粒(英语:Liposome)也称为微脂粒,是一种具有靶向给药功能的新型药物制剂。脂质粒是利用磷脂双分子层膜所形成的囊泡包裹药物分子而形成的制剂。由于生物体质膜的基本结构也是
- 等电子体等电子体是指具有相同价电子数并且具有相同结构的微粒,可以是原子,分子或离子。具有相同的通式——AXm,而且价电子总数相等的分子或离子具有相同的结构特征,这个原理称为等电子
- 铯蒸气压第一:375.7 kJ·mol−1 第二:2234.3 kJ·mol−1 第三:3400 kJ·mol主条目:铯的同位素铯(Cesium,旧译作鏭)是一种化学元素,化学符号为Cs,原子序为55。铯属于碱金属,带银金色
- 昭宣之治昭宣之治又称昭宣中兴,为西汉汉昭帝和汉宣帝在位时期(约为公元前87年至前49年)着重休养生息,以恢复汉武帝在位时严重损耗的国力,并将汉朝国力推上太平盛世。后世历史学家评定此段
- 艾尔基·罗斯拉堤艾尔基·罗斯拉堤(芬兰语:Erkki Ruoslahti,1940年2月16日-),芬兰裔美国医学家,美国国家科学院院士,加州大学圣塔芭芭拉分校教授。罗斯拉堤名列汤森路透引文桂冠奖,被看好角逐诺贝尔生
- 四跨膜蛋白结构 / ECOD四跨膜蛋白家族(transmembrane 4 superfamily,TM4SF)是一组小分子量的糖蛋白,分子量范围在20一 50kDa之间,大约由20多个成员组成,是多种组织细胞的膜组成成分,其中大多