语音合成

✍ dations ◷ 2025-12-07 20:40:37 #语音合成
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(Text-To-Speech,TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。而合成后的语音则是利用在数据库内的许多已录好的语音连接起来。系统则因为储存的语音单元大小不同而有所差异,若是要储存phone以及diphone的话,系统必须提供大量的储存空间,但是在语意上或许会不清楚。而用在特定的使用领域上,储存整字或整句的方式可以达到高品质的语音输出。另外,包含了声道模型以及其他的人类声音特征参数的合成器则可以创造出完整的合成声音输出。一个语音合成器的品质通常是决定于人声的相似度以及语意是否能被了解。一个清晰的文字转语音程式应该提供人类在视觉受到伤害或是得到失读症时,能够听到并且在个人电脑上完成工作。从80年代早期开始,许多的电脑操作系统已经包含了语音合成器了。早在17世纪就有法国人研发机械式的说话装置。直到19世纪,贝尔实验室对于电子语音合成技术的研究,才开启近代语音合成技术的发展。贝尔实验室在1939年制作出第一个电子语音合成器VODER,是一种利用共振峰原理所制作的合成器。 1960年,瑞典语言学家G. Fant则提出利用线性预测编码技术(LPC)来作为语音合成分析技术,并推动了日后的发展。后来1980年代Moulines E和Charpentier F提出新的语音合成算法PSOLA,此技术可以合成比较自然的语音。这通常是使用字词预录的方式,将各字词的发音预先录制好,经处理后存放在数据库中。使用时再将预发音的字句断成字词,再把发音的资料自数据库中取出,交由DSP去处理发音的合成。

相关

  • 高胆红素血症胆红素(英文:Bilirubin)是胆色素的一种,是人类胆汁的主要色素,呈橙黄色。它是体内血红素的主要代谢产物,有毒性,可对大脑和神经系统引起不可逆的损害,但也有抗氧化剂功能,可以抑制亚
  • 免疫球蛋白E免疫球蛋白E(英语:Immunoglobulin E,简称IgE)是一类只发现于哺乳动物内的抗体,是正常人血清中含量最小的免疫球蛋白。免疫球蛋白E由黏膜下淋巴组织中的效应B细胞合成,IgE的单体由
  • 大中东地区大中东地区(英语:The Greater Middle East)是美国乔治·W·布什政府于21世纪的前10年创建来描述穆斯林世界附近的国家,尤其是伊朗、土耳其、阿富汗和巴基斯坦的政治地理学名词。
  • 脸颊脸颊(拉丁语:buccae)是指眼睛下部,鼻子周围到左右耳的表面部分。具体是指人类和哺乳动物面部皮肤直到下巴的部分,并且在眼睛和颧骨的下部内形成了口腔侧壁。在脊椎动物亚门中,脸颊
  • 2,3-环氧鲨烯(S)-2,3-环氧鲨烯(英语:(S)-2,3-epoxysqualene)也叫做(S)-2,3-氧化鲨烯(英语:(S)-2,3-Oxidosqualene)是甾体前体羊毛甾醇、环阿屯醇以及皂苷合成的中间产物,由角鲨烯通过鲨烯环氧化
  • 料理烹饪,又称烹调、烹煮、炊煮、造饭、做菜,指将食材处理并制作成食物、菜肴、餐点、膳食的方法。一个好的菜肴,色香味形俱佳,不但让人在食用时感到满足,而且能让食物的营养更容易被
  • bspan style=color:white;巴利阿里群岛/span/b巴利阿里群岛(加泰罗尼亚语:Illes Balears,.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000",
  • 獴科(学名:Herpestidae),哺乳纲食肉目的一科,外形较像猫,有猫鼬的别称。包括獴亚科及缟獴亚科两个亚科。以下几属过去归为獴科,现在被分入食蚁狸科(Eupleridae):
  • 氧化钠氧化钠,分子式Na2O,是钠的正常氧化物,常温下是白色固体。其性质极活泼,为碱性氧化物,与水反应生成氢氧化钠。在空气中加热能生成浅黄色的过氧化钠。氧化钠可由钠和氧反应制得:氧化
  • 可变数目串联重复可变数目串联重复(或VNTR)是基因组中的位置,其中短核苷酸序列被组织为串联重复。这些可以在许多染色体上找到,并且经常显示个体之间的长度变化(重复的数量)。 每个变体充当遗传等