语音合成

✍ dations ◷ 2025-11-25 01:53:34 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 内科学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学内科学是临床医学的专科,几乎是所有其
  • 鼻子整形鼻外观整型手术 (英文:Rhinoplasty)、又被称为隆鼻,是一种将鼻子的外观进行调整或重建的一种行为,主要诉求为使鼻子更加的美观,常用于解决一些因意外引发的鼻部外伤,或由于先天性缺
  • 嘴唇嘴唇是在人类及许多动物的脸上一个明显易见的器官,由上下两唇构成。两唇皆为凸出而柔软、并能由内部肌肉牵引而自由移动。唇是一个触觉器官,主要功能为帮助进食以及准确闭合发
  • 甲状舌骨膜甲状舌骨膜(thyrohyoid membrane、或 hyothyroid membrane(甲状腺膜))是喉部的一种宽广,且呈纤维弹性的片状膜体。甲状舌骨膜的下面附着在甲状软骨的上边缘及其上角部的前方,在
  • 安德雷亚斯·维萨里安德雷亚斯·维萨里 (拉丁语:Andreas Vesalius,荷兰语:Andries van Wesel;1514年12月31日于布鲁塞尔-1564年10月15日于扎金索斯)是一名文艺复兴时期的解剖学家、医生,他编写的《人体
  • 销售产品 · 定价 · 分销 服务 · 零售 · 宣传 品牌管理 · 大客户营销 营销道德 · 营销效果 营销调查 · 市场调查 市场划分 · 营销战略 市场优势 · 操
  • 多巴胺β羟化酶n/an/an/an/an/an/an/an/an/an/a多巴胺β羟化酶 (英语:Dopamine β-hydroxylase,简称DBH)是一种多巴胺转化为去甲肾上腺素的酶。多巴胺β羟化酶是一个由四个相同亚基组成的290千
  • ΘTheta(大写Θ,小写θ,中文音译:西塔),是第八个希腊字母。大写的Θ是:小写的θ是:西里尔字母的Ѳ是从Theta变来。日本理光公司于2013年推出一款全天球相机,名字即为THETA。
  • 瓦兹河谷省瓦兹河谷省(法语:Val-d'Oise),或音译为瓦勒德瓦兹省,是法国法兰西岛大区所辖的省份。该省编号为95,属于巴黎的市郊地带。瓦兹河谷省的编号95不像法国其它省份那样按照字母顺序排列
  • 苏格兰王国英国苏格兰王国(英语:The Kingdom of Scotland、苏格兰盖尔语:Rìoghachd na h-Alba、低地苏格兰语:Kinrick o Scotland),是位于西欧的一个古国,最大版图包括大不列颠岛北部以及周