语音合成

✍ dations ◷ 2024-11-05 22:45:43 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 3s22, 8, 2蒸气压第一:737.7 kJ·mol−1 第二:1450.7 kJ·mol−1 第三:7732.7 kJ·mol−1 (主条目:镁的同位素镁(Magnesium)是一种化学元素,它的化学符号是Mg,它的原子序数是12,是
  • 公共假日美国节日,有美国联邦政府法定假日和其他节日之分。1971年生效的美国统一假期法案(英语:Uniform Monday Holiday Act)对美国联邦节假日有了比较一致的规定。美国联邦政府雇员一般
  • 茶句县茶句县(越南语:Huyện Trà Cú/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H","M
  • 尿尿,又称尿液,是人类和脊椎动物为了新陈代谢的需要,经由泌尿系统及尿路排出体外的液体排泄物。排出的尿液可调节机体内水和电解质的平衡以及清除代谢废物且可同时散热,尤其是退化
  • 哈尔滨医科大学哈尔滨医科大学,简称哈医大,位于黑龙江省哈尔滨市,是中国最早成立的医科大学之一,中西部高校基础能力建设工程院校。1926年9月,中国医学先驱伍连德博士创建哈尔滨医学专门学校,即
  • R01ADATC代码R(呼吸系统)是解剖学治疗学及化学分类系统的一个分类,这是由世界卫生组织药物统计方法整合中心(The WHO Collaborating Centre for Drug Statistics Methodology)所制定的
  • Γ-丁内酯γ-丁内酯(英语:gamma-Butyrolactone,简称GBL)是一种易潮解的无色油状液体,有较弱的特征气味并且能溶于水。γ-丁内酯是化学中的一个常见溶剂和反应试剂,它也被用作一种芳香物、去
  • 代谢率基础代谢率(英语:basal metabolic rate,首字母缩写BMR)是指在自然温度环境中,恒温动物(比如人)的身体在非剧烈活动的状态下,处于非消化状态,维持生命所需消耗的最低能量。这些能量主
  • 溴化镁溴化镁,化学式MgBr2,是由溴和镁组成的白色或无色易潮解物质。通常在治疗神经紊乱中用作镇静剂或抗痉挛药物。 溴化镁溶于水,部分溶于乙醇。在水氯镁石或光卤石中存在少量。亦可
  • 荷兰省级政治荷兰政府与政治 系列条目荷兰省级政治是构成荷兰政治的网络之一,省份的地位仅次于中央政府,而省级政治由十二个省分主导。省级单位的官员主要有三种来源:第一种是女王专员,第二