语音合成

✍ dations ◷ 2025-04-04 06:27:22 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 异烟肼异烟肼(肼,汉语拼音:jǐng)(英文名:Isoniazid, Laniazid, Nydrazid, INH,全名为isonicotinic acid hydrazide),又称4-吡啶甲酰肼、雷米封(Rimifon),是异烟酸的酰肼。异烟肼为无色结晶或
  • 绒毛结节性滑膜炎绒毛结节性滑膜炎(英语:Villonodular synovitis)是一种滑膜(英语:synovial membrane)肿胀的疾病。有以下几类:尽管它们的名称完全不同,但它们有相同的组织学,且CD68(英语:CD68)、HAM56和
  • 机会感染机会性感染又名伺机性感染(英语:opportunistic infection)是指由机会性病原体引发的感染。这些病原体寄生于免疫功能正常的健康宿主时不致病,但会在宿主出现免疫缺陷时入侵宿主
  • 艾司西酞普兰艾司西酞普兰(英语:Escitalopram),或称依地普仑 ,商品名为立普能(Lexapro)等,是一种选择性5-羟色胺再摄取抑制剂(SSRI)类抗抑郁药。 美国食品药品监督管理局(FDA)批准其用来治疗成人和12
  • 49,XYYYYXYYYY综合征(英语:XYYYY syndrome),是一种罕见的Y染色体数目异常疾病。中度至重度智能障碍、言语延迟、肌张力低、巨脑室、脑白质异常、脊柱侧弯、复发性上呼吸道感染、肘外翻、
  • 福尔马林福尔马林(英语:Formalin),是甲醛含量为35%至40%(重量百分比为37%;体积百分比为40%)的水溶液,也加入10%~15%的甲醇防止聚合。具有防腐、消毒和漂白的功能,不同领域各有其作用,但福尔马林
  • 子宫卵巢摘除术子宫卵巢摘除术是指通过医学手段,摘除哺乳动物的卵巢。此手术方式为不可逆手术,一旦进行了便不可能再次回复怀孕的可能性。一般来说如非是肿瘤等问题,一般人类不太会选择此方式
  • 纽约泛欧证券交易所纽约泛欧证券交易所(英语:NYSE Euronext)是一家曾经存在的证券市场营运商,由纽约证交所和泛欧交易所在2007年4月合并而成,当时是全球最大的股票市场之一,总部位于纽约。2013年,纽约
  • 霍奇金艾伦·劳埃德·霍奇金爵士,OM,KBE,FRS(英语:Sir Alan Lloyd Hodgkin,1914年2月5日-1998年12月20日),英国生理学家与生物物理学家,与安德鲁·赫胥黎(Andrew Fielding Huxley)因为共同研究
  • 雍正雍正(满语:ᡥᡡᠸᠠᠯᡳᠶᠠᠰᡠᠨ ᡨᠣᠪ,穆麟德:hūwaliyasun tob,太清:hvwaliyasun tob,大词典:huuwaliyasun tob;蒙古语:.mw-parser-output .font-mong{font-family:"Menk Hawang