语音合成

✍ dations ◷ 2025-07-24 08:11:19 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 环氧酶环氧合酶(拉丁语:Cyclooxygenase,简称COX)是一种酶(又名酵素),负责合成重要的生物激素——前列腺素家族的导介物质。当身体组织受到某种刺激如外伤、感染等会激活环氧合酶,使花生四
  • 毛癣菌毛癣菌属(学名:Trichophyton)是子囊菌门下的一种真菌。其菌丝可以产生光滑直筒状的大分生孢子(macroconidia)与许多小分生孢子(microconidia)。其中大分生孢子直接在菌丝侧向生长,呈
  • 核裂变核裂变(德语:Kernspaltung;英语:nuclear fission),在港台称作核分裂,是指由较重的(原子序数较大的)原子,主要是指铀或钚,裂变成较轻的(原子序数较小的)原子的一种核反应或放射性衰变形式
  • 公元前1世纪公元前100年1月1日至前1年12月31日的这一段期间被称为前1世纪。
  • 脑控脑控是指代用电脑、无线电、电磁辐射(如微波听觉效应)、或其他科学技术手段,远程控制受害者的大脑精神、意识,即“Electronic harassment”所称的精神控制(Mind control)。脑控是
  • 性别研究性别研究(英语:gender studies)是一个跨学科研究的学术领域,核心研究范围为性别认同和社会性别代议。性别研究这一领域包含了妇女研究(探讨女性、女性主义、性别身份、政治)、男性
  • 铁架台铁架台是一种常用实验器材,可以通过十字夹或万能夹等工具来扩展,以此来支撑如试管、滴定管等实验器材。铁架台也可以和铁圈相组合用于过滤。铁架台的底座通常使用不锈钢制成,可
  • IPCC AR5 WG1政府间气候变化专门委员会(英语:Intergovernmental Panel on Climate Change,缩写IPCC;又译政府间气候变化专业委员会、跨政府气候变化委员会等)是一个附属于联合国之下的跨政府
  • 苹果派苹果派(英语:Apple pie),或称苹果馅饼,是一种西式水果馅饼,属于甜点分类,馅料主要材料是苹果;苹果派起源于欧洲,但是现在却是象征美国文化最具代表性的甜点之一。在西方,许多的场合都
  • 圣日耳曼德普雷区圣日耳曼德普雷区(Saint-Germain-des-Prés)是法国巴黎市第六区内的一个区域,位于圣日耳曼德普雷修道院附近一带。圣日耳曼德普雷区拥有许多著名的咖啡馆,例如双叟咖啡馆(Les Deu