语音合成

✍ dations ◷ 2025-12-03 06:42:33 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 垂体脑下垂体(法语、德语: Hypophyse,英语:pituitary gland,亦称为脑垂体)位于脑底部的中央位置,在蝶骨中的蝶鞍内,它的上方有视神经经过,两侧被海绵静脉窦所包围,它的底部为蝶窦及鼻咽。
  • 廊开府廊开府(泰语:จังหวัดหนองคาย,皇家转写:Changwat Nong Khai,泰语发音:)为泰国东北部之一个府。该府原名为“曼派村”,原属老挝的“万象城”统治。拉达那哥欣王国时代,该
  • 旋毛虫病旋毛虫病(Trichinosis)是指因旋毛虫(属于线虫动物门)感染所引起的寄生虫疾病。人体在感染后旋毛虫侵入肠胃道,故会产生腹痛、腹泻及呕吐等症状;约一星期后虫体会侵犯至肌肉,导致脸
  • 第勒尼安海第勒尼安海(或译提雷尼亚海;意大利语:Mar Tirreno;撒丁语:Mari Tirrenu)是地中海的一部分,位于意大利半岛西面。海域被意大利的萨丁岛、西西里岛、利古里亚、托斯卡纳、拉齐奥、坎
  • H[BFsub4/sub]Hydrofluoroboric acid Hydrogen Tetrafluoroborate三氟甲磺酸氟硼酸,是一种无色透明的强酸,化学式为HBF4,是氟硼酸盐的共轭酸。氟硼酸在浓性溶液中稳定,加热到130 °C时分解。
  • 4d5 5s22, 8, 18, 13, 2蒸气压((推断))第一:702 kJ·mol−1 第二:1470 kJ·mol−1 第三:2850 kJ·mol主条目:锝的同位素锝(拼音:dé,注音:ㄊㄚˇ,粤拼:dak1,台湾称
  • 费耶特县费耶特县(英语:Fayette County, Georgia)是美国乔治亚州西北部的一个县。面积516平方公里。根据美国人口调查局2000年统计,费耶特县人口共有91,263人,其中白人占83.87%、非裔美国
  • 钢琴教师《钢琴教师》(法语:La Pianiste)是一部2001年电影,迈克尔·哈内克导演,伊莎贝尔·于佩尔和伯努瓦·马西莫勒(英语:Benoît Magimel)主演,2004年诺贝尔文学奖得主艾尔弗雷德·耶利内克
  • CD164876353599ENSG00000135535ENSMUSG00000019818Q04900Q9R0L9NM_006016、NM_001142401、NM_001142402、NM_001142403、NM_001142404、NM_001346500NM_016898NP_001135873、NP_0
  • 官学国学指国家学府,即古代中国和周边地区如朝鲜、越南、日本、琉球等国的中央学府,为官学体系的最高学府。为古之大学。虞之上庠,夏之东序,殷之瞽宗,周之辟雍,汉后之太学,隋后之国子监