语音合成

✍ dations ◷ 2025-12-05 04:19:49 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 信仰疗法信仰治疗(英语:Faith healing),是指透过祈祷或宗教灵修的方式,对生理或心灵上的疾病,借着上帝或神灵的力量,进行医治及治疗。一些意见认为,宗教治疗的疗效,能间接提供有上帝或超自然
  • 假体假体或假肢(英语:Prosthesis 或 Prosthetic implant)指人造肢体,用来取代肢体的功能障碍(不论暂时性或永久性),或是用来掩饰肢体伤残。与义体(如义乳、假鼻子、假发、假牙)最大的不同
  • 高渗剂张性(英语:Tonicity)是形容细胞内和细胞外的渗透压比例、溶质浓度比例及水势比例。当细胞置于高渗溶液(英语:hypertonic solution)中,细胞内的渗透压会小于细胞外的渗透压,细胞内的
  • 嫩煎煸炒是炒的一种,为中餐的一种常见烹调方法。煸炒的操作是先将炒锅内放少量底油,烧热,加入原料快速翻炒至熟透,调味而成。特点是鲜嫩汁薄。另外,一些菜肴经煸炒初步烹调原料后,再进
  • 票房佳绩全球最高电影票房是在全球上映的电影票房等相关列表。数字只包含影院票房收入,不包含其他营利方式的收入,(如光盘租售、电视播映等)。票房以美元为单位。更新日期:2020年3月17日
  • 国家宪兵干预队法国国家宪兵干预组(法语:Groupe d'intervention de la gendarmerie nationale,缩写:GIGN)隶属于法国国家宪兵,为一支特种部队,负责反恐及拯救人质等等任务。国家宪兵干预组分为1个
  • 张道陵张道陵(34年-156年),一名张陵,字辅汉,东汉沛国丰县(今江苏徐州市丰县)人,被视为正一道的创始者,是五斗米道的创始人。道教徒称他为张道陵天师、祖天师、正一真人。相传张道陵以虎为座
  • 鞑靼族.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-settings:
  • 博奈尔岛面积以下资讯是以2015年估计家用电源国家领袖立国历史博奈尔(荷兰语:Bonaire)是加勒比海中一岛屿,现为荷兰的公共实体(英语:Public body (Netherlands)),与附近的荷兰王国构成国阿鲁
  • CD45n/an/an/an/an/an/an/an/an/an/a蛋白酪氨酸磷酸酶C型受体(英语:Protein tyrosine phosphatase, receptor type, C,缩写:PTPRC)是一个由PTPRC人类基因编码的酶 蛋白酪氨酸磷酸酶C