语音合成

✍ dations ◷ 2025-09-16 14:10:17 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 住院医师人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学医生又称医师,在中国古代称大夫或郎中
  • 胆管胆管为胆汁由肝脏传送至十二指肠的一个管道。肝内的胆小管逐级合并成左、右肝管,出肝门再合成为肝总管;肝总管与胆囊管汇合成胆总管。肝细胞持续不断的制造胆汁浓缩并储存于胆
  • 俄克拉何马州坐标:35°30′N 98°00′W / 35.5°N 98°W / 35.5; -98俄克拉荷马州(切罗基语:ᎠᏍᎦᏯ ᎩᎦᎨᏱ,转写: Asgaya gigageyi,或者ᎣᎦᎳᎰᎹ(音译自英语);波泥语:Uukuhuúwa;卡育加语:Ga
  • 三日疟原虫Haemamoeba malariae Feletti and Grassi, 1889 Plasmodium malariae var. quartanae Celli and Sanfelice, 1891 Plasmodium malariae quartanae Kruse, 1892 Haemamoeba l
  • 安理会常任理事国联合国安全理事会常任理事国是联合国安全理事会中的常任成员(俗称五常),五个创始成员国是二战期间同盟国中的五大国。其中,中国和俄罗斯的代表政权曾有所改变。中国原由中华民国
  • 盘尼西林青霉素(Penicillin,或音译盘尼西林)是指分子中含有青霉烷、能破坏细菌的细胞壁并在细菌细胞的繁殖期起杀菌作用的一类抗生素,是由青霉菌中提炼出的抗生素。青霉素属于β-内酰胺
  • 数量性状基因座数量性状基因座(英语:Quantitative trait loci,简称为QTLs)是一段含主控或联系数量性状的基因的DNA。可通过如AFLP或更常见的SNP等分子标签将这些控制数量性状的基因定位到基因
  • 运动蛋白驱动蛋白(英语:Kinesin)是一类蛋白质超级家族,属于分子马达的一种,其成员代表驱动蛋白-1(Kinesin-1)在1985年被发现。驱动蛋白是由单体组成的多聚体,其“头部”具有ATP酶活性,能通过
  • 冠轮动物参见正文冠轮动物(拉丁语:Lophotrochozoa)是动物界中的一大支,属于两侧对称动物,与蜕皮动物(Ecdysozoa)组成原口动物。原口动物和后口动物(Deuterostomia)并列为两侧对称动物的两个分
  • 磷酸双酯键磷酸二酯键(英语:phosphodiester bond)也称为“3′,5′-磷酸二酯键”或“磷酸双酯键”,是核酸分子中的磷酸基团的磷原子与另外两个五碳糖分子的碳原子之间形成的共价键。这种形